纵观百度MP3的数据,发现来源就那么几个站。
谷歌采用正版人工的歌曲大概30多万。
两大搜索引擎都有收入歌不足问题。
基于本文的理念基本能够充分扩大和更新信息和资源,
起码超过他们是没有问题的,实践已经证明。
 
做搜索,对于歌曲的信息获取,根据大量站点
和实际数据证明,现阶段,音乐站本质信息提
取,有两类页面,专辑信息页和试听页。如果
能够充分获取这两类页的信息,是可以解决绝
大部分歌曲信息抽取和覆盖面。本文只谈信息
提取,不谈资源下载,资源下载当然能够解决,
并且已经解决和试验。
音乐信息分老的和新的,老的可以基于这两类
页遍历获取,那么新的和将有的如何处理呢?
同样基于这两类实时更新。
 
至于怎么抽取有用信息,这就要根据各个搜索
引擎现状和环境决定。但大体一样,详细步骤
就不说了,只是把这个方法理念提出来,希望
多多批评指正;已实现这个理念,实践证明效果
不错。