爬虫练习：爬取网易云音乐热歌榜全部歌曲的热门评论

元口

于 2018-08-28 22:35:45 发布

阅读量2.8k

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41230365/article/details/82155738

版权

目标：爬取网易云音乐热歌榜中全部歌曲(共200首)的热门评论（每首歌有15个热门评论）

分析：

需要分两步走，第一步是定位到热歌榜单所在的资源，从而得到这热歌榜中到底有哪些歌并获得每首歌的id；第二步是根据上一步得到的每首歌的id，定位到单独每首歌所在的资源，从而得到每首歌下的评论信息。具体讲：

1）首先我们需要得到热歌榜数据所在的url，经浏览器开发者工具查看网页代码，得知热歌榜的数据所在的请求url是：

http://music.163.com/discover/toplist?id=3778678

这个url的请求方式是get方式，返回的是html的doc文档，这个文档中的第610行就包含了每首歌的歌名，id，以及对应的播放资源链接。

所以我们的第一个任务就是把该html文档爬取下来，提取出所有歌曲的名称及id。有了歌曲id之后，我们可以进一步通过这个id访问到每一首歌的具体信息。

2）在网页上点进某一首歌的链接，分析弹出的每首歌单独的新页面的Network情况，我们可以分析出包含该首歌歌评的请求url为：

http://music.163.com/weapi/v1/resource/comments/R_SO_4_489998494?csrf_token=，

请求方式是post(因为评论需要往服务端发送数据)，返回的是json文件，在该json文件中就包含了我们需要的热门评论。在这里唯一有点棘手的地方是发送post请求时需要两个参数，而不同的歌这两个参数是不同的(然而程序中用的参数是相同的)，关于这两个参数如何定，具体介绍在下面的链接中。

所

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。