一、问题描述:
本次爬取的对象是QQmusic,为自己后面做django音乐网站的开发获取一些资源(包括一些VIP的歌曲)。
二、问题分析:
由于QQmusic和网易音乐的方式差不多,都是讲歌曲信息放入到播放界面播放,在其他界面没有media的资源,喜马拉雅的则不是这样的,可以参考我爬取喜马拉雅的blog与代码:https://www.cnblogs.com/future-dream/p/10347354.html。
1.由于上述原因,我们需要对网页进行分析:
获取歌曲菜单的id——>歌曲的所有id信息——>播放网站URL的构建,我们所有的一切都是为播放网站参数需要而努力,得到了对应的参数剩下的就很简单。
(1)歌曲菜单界面
(2)歌曲id信息
(3)播放网站的解析
三、实施步骤:
爬虫基本的思路都是倒序根据需要的信息一步一步往上