最近做了个短期程序“百度MP3搜索”,把内容帖一帖

原创 2004年09月24日 16:13:00

百度MP3设计文档:<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />

 

(<?xml:namespace prefix = st1 ns = "urn:schemas-microsoft-com:office:smarttags" />2004-9-13renzhongfang@nju.org.cn,有丰富输入法编程、串口编程网络编程、网站设计、数据库编程经验,CVCjavaVB

 

1、需求

功能:通过程序从baidu(http://mp3.baidu.com/搜索内容,并提出内容(主要是URL地址),
主要要提交2个函数
void GetLyric(string SongName, string SingerName, string &Lyric);
  // 获得歌词
要求:
  SingerName为空时,对SongName的搜索进行精确匹配
  SingerName不空时,对SingerNameSongName作精确匹配


bool GetMusicUrl(bool test, MusicType type, string SongName, string SingerName,
string &Url1, string &Url2, string &Url3);
                // 获得歌曲链接
要求:
  当testTRUE时,对所取到的URL进行连接测试,要求至少有两个可以连接
  当testFALSE时,不做连接测试
  enum MusicType { ALLMUSIC,MP3,RM,WMA,FLASH } 分别对应着baidu上的全部音乐,mp3,rm,wma,flash不同类型。根据类型的不同,分别取不同的URL
  SingerName为空时,对SongName的搜索进行精确匹配
  SingerName不空时,对SingerNameSongName作精确匹配
  返回值:
当输入SongName与搜索到的mp3名称不符时,返回FALSE
当输入SongName与搜索到的mp3名称相符时,返回TRUE


提交内容:源程序及Demo程序,文档

要求语言:C++,最好用VC开发,用wininetwinhttp,不要用其它的http library

 

 

2、设计思路

从向BAIDUMP3搜索引擎模拟发送HTTP请求,获取网页内容然后提取歌词或者歌曲链接

分析1、百度MP3搜索的HTTP请求格式:

搜索“吻别”:

歌词:  http://mp3.baidu.com/m?tn=baidump3lyric&ct=150994944&rn=10&word=吻别&lm=-1

ALLMUSIC: http://mp3.baidu.com/m?rn=&tn=baidump3&ct=134217728&word=吻别&lm=-1

MP3:  http://mp3.baidu.com/m?tn=baidump3&ct=134217728&rn=&word=吻别&lm=0

RM:    http://mp3.baidu.com/m?tn=baidump3&ct=134217728&rn=&word=吻别&lm=1

WMA:  http://mp3.baidu.com/m?tn=baidump3&ct=134217728&rn=&word=吻别&lm=2

FLASH: http://mp3.baidu.com/m?tn=baidump3&ct=134217728&rn=&word=吻别&lm=6

 

仔细分析上面的链接会发现请求分为这么几段:

HTTP HEAD http://mp3.baidu.com/m?

rn : 歌词时为10其他为空

tn : 查歌词时为baidump3lyric,查歌曲时为baidump3

ct : 查歌词时为150994944,查歌曲时为134217728

lm : 查歌词和查所有歌曲时为-1MP3, RM, WMA, FLASH分别对应0, 1, 2, 6

word : 要查询的内容

 

其中rn, tnlm的值都是不变的,而ct的值每天都在变化,需要先获取,检查http://mp3.baidu.com/的源代码发现如下这段代码:

function syn(form)

{

  if (form.lm[0].checked){

    form.rn.value="10";

    form.tn.value="baidump3lyric";

    form.ct.value="150994944";

  } else{

    if(form.lm[6].checked){

      form.tn.value="baidump3ring";

      form.ct.value="285212672";

    } else {

       form.tn.value="baidump3";

       form.ct.value="134217728";

    }

  }

}

这样就可以先从http://mp3.baidu.com/提取ct的内容然后用来查询,提取方法有三种:

1、分析源代码,构建ifelse二叉树,

2、找到form.lm[0].checkedform.lm[6].checked再查值

3、找到form.tn.value="xxxxxxx",然后查它附近的ct值即可

附近的:提取网页源码后,找到form.tn.value位置,向前找到{的位置,向后找到}的位置,这里面的内容里找到ct.value就是相应的tn.value对应的内容。

 

这些值确定下来以后,就可以根据用户查询内容来构造查询的HTTP请求了。

 

根据查询内容的HTTP请求获得源码内容以后,可以从中提取歌词和歌曲,提取关键词如下:

歌词:

string lyricHead = "<b><font size=+1><font style=color:#e10900>";

string lyricTail = "<p align=right>";

 

歌曲:
string songLinkHead = "word-break :break-all/"><a href=/"";

 

 

3、主要函数说明:

//获取一个URL对应的HTML源文件,使用了CHttpGet类(自己做的,有源码)

string GetURLPage(string url)

 

//测试一个URL的链接是否可用,使用了CHttpGet类(自己做的,有源码)

bool testConnection(string url)

 

//清除空格、回车、换行、tab

void ClearSpaces(string &str)

 

//初始化ct的值,成功则返回true,否则返回false

bool Initialize()

 

//析取page里面的音乐链接

vector<string> TearSongURLs(string page)

 

//去除html标志串

void StripTags(CString &html)

 

//析取page里面的第一个歌词

string TearLyric(string page)

 

//构造查询用的URL

string BuildURL(int searchIndex, string songName, string singerName)

 

//要提供的两个API

void GetLyric(string songName, string singerName, string &lyric)

bool GetMusicUrl(bool test, MusicType type,

string songName, string singerName,

string &url1, string &url2, string &url3)

 

[回答sqzxcv 的]如何实现 c# 调用 搜索引擎

问题:我想在一个TextBox里面输入一段内容,然后用程序转到百度里面进行搜索,将搜索结果用百度的网页在我的WebBrowser里面显示,我该怎么做? 就像在浏览器上的插件,在一个文本框里面输入内容,...
  • linjiancun
  • linjiancun
  • 2009年04月24日 14:24
  • 1843

用kd树的最近邻搜索

算法:\qquad 输入:已构造的 kdkd 树;目标点 xx ; \qquad 输出:xx 的最近邻。 \qquad (1) 在 kdkd 树中找出包含目标点 xx 的叶节点:从根节点出发,递归...
  • FeynmanWang
  • FeynmanWang
  • 2015年07月24日 15:17
  • 478

K个最近的点

给定一些 points 和一个 origin,从 points 中找到 k 个离 origin 最近的点。按照距离由小到大返回。如果两个点有相同距离,则按照x值来排序;若x值也相同,就再按照y值排序。...
  • ssdut2013
  • ssdut2013
  • 2017年07月07日 14:06
  • 1403

未来3个月短期目标(2017.8.8-2017.11.8)

下面是我对自己未来三个月做出的一个短期生活工作目标,我会每天睡觉前更新这个list的每一项的进度,希望可以通过这种方式,更好的去提高自己,督促自己进步。just do it 读完《重构-改善既有代码的...
  • liuhannan111
  • liuhannan111
  • 2017年08月08日 16:41
  • 868

最近做了个营销网站

hi 大家好!                     我在自学网学习了怎么做网站,用一个月的时间,我做了个电子书网站,希望你们进去看看,给我评评,谢谢!http://zrl8614.cscces.c...
  • u011786801
  • u011786801
  • 2013年08月23日 04:47
  • 392

c++ 实现百度自动搜索

void CAttendanceRobotDlg::DocumentCompleteExplorer4(LPDISPATCH pDisp, VARIANT* URL) { // TODO:...
  • zww0815
  • zww0815
  • 2016年04月28日 16:16
  • 419

简单五子棋实现

简单五子棋实现做题学基础知识的过程中做到一题井字游戏结果判断,深入后想尝试做一个简单的五子棋游戏,完成后在此做一个小小的总结。源码地址:简单五子棋源码 tkinter模块的布局,画布,鼠标单击事件绑...
  • wjb19900815
  • wjb19900815
  • 2017年12月28日 15:42
  • 39

百度搜索引擎和必应搜索引擎搜索内容简单爬取Python

这个博客用于记录我的计算机学习的路途,本文用于记录Python百度搜索爬虫编写过程。 第一步 本程序所用的python库 1,requests 用于GET网页返回的信息,这个库比较重要。可以用来模...
  • Greepex
  • Greepex
  • 2017年05月18日 16:40
  • 2301

百度MP3搜索遭遇铁通

有朋友反映,近几天铁通网络在使用百度MP3搜索时,返回诸如以下提示:  “抱歉,没有找到与“*” 相关的MP3内容。   百度建议您: 在百度网页中查找“* mp3” 看看输入的文字是否有误 查看关于...
  • tomhanxisi
  • tomhanxisi
  • 2007年11月27日 11:24
  • 803

Android练习项目 Mp3播放器实现(一)

对于Android的学习,需要掌握的东西有点多,需要我们认真,小心,不断的进取。前天突然有个想法,觉得Mp3播放器是一个可以练习的项目,于是在网上搜了下,发现有人已经写了博客,看了他们的博客后,我觉得...
  • u013766436
  • u013766436
  • 2016年04月16日 23:09
  • 5051
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:最近做了个短期程序“百度MP3搜索”,把内容帖一帖
举报原因:
原因补充:

(最多只允许输入30个字)