利用API爬取QQ音乐评论

本文介绍了如何使用Python爬取QQ音乐中的歌曲《你不要担心》的前十页评论及对应用户信息。首先分析QQ音乐网页,查看robots.txt确定爬取权限,接着找到评论数据的API链接,最后编写爬虫代码获取评论内容。
摘要由CSDN通过智能技术生成

Python爬取QQ音乐单曲

爬虫步骤
1.爬虫准备
python安装了request模块,Chrome浏览器,明确目标,本次爬取的是QQ音乐《你不要担心》的前十页评论及对应的用户。
2.爬虫分析
首先我们打开 (QQ音乐网页),然后搜索 你不要担心,点击第一个结果进入歌曲的详情页(你不要担心——李迪),歌曲评论在详情页下方。然后我们打开 QQ 音乐的 robots.txt,看看是否禁止我们爬取,内容如下:在这里插入图片描述
看上去只是禁止爬取 playlist 相关的信息,我们爬取歌曲评论应该问题不大。
点击 Network 中的 XHR 过滤其他类型的请求,得到我们想要的API链接。
在这里插入图片描述
评论数据就在 comment 下的 commentlist 中,commentlist 中的每一项都有 nick、avatarurl、rootcommentcontent等数据。我们可以确认评论的数据就是通过它获取的。
在这里插入图片描述
3.编写代码

import requests
import time
#请求头
headers = {
   
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.162 Safari/537.36'
    }
lasthotcommentid = ''
  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值