- 前言
完整的QQ音乐爬虫程序分两个部分: 歌曲下载模块 + 歌曲详细信息提取模块
- 歌曲下载模块构建
网页构成分析:
(1)找到QQ音乐的下载网址
播放页面中,刷新F5,查看文件类型,有个type 为媒体文件media 且比较大 几M,点进去看;
然后就找到了本歌曲的下载网址:
(2)分析网址:
取两首歌曲的网址对比:
http://dl.stream.qqmusic.qq.com/
C400003YDLNN4EIffX.m4a?
vkey=A308D712991EBD1D53F9B5838A4C3701CB555FA14CF338E75815DA7464FA79167A44352CD7682EAC7ABBD29CFA2A27BEBA9C8273E8E8CB00
&guid=6964837424&uin=0&fromtag=66
Adventures 歌曲的链接:
http://dl.stream.qqmusic.qq.com/
C400001O6xe10VDdA5.m4a?
vkey=2B345A6EFF534205F7D3FC37CB6526A99172E2F0D5AD657103EAA023A9F3F7EB035D12C510CA67897F255C31A9CD6911B6AF761CD0619226
&guid=6964837424&uin=247990761&fromtag=66
规律:
需要提前歌曲链接得参数:
- fileindex
- vkey
guid/uin/fromtag每首歌都是一样的
然后任务变成找到提前歌曲参数的链接,提取信息;
(3)
提取生成歌曲链接所需参数:
先记住我们要找的东西:
vkey 例如