相关文章
强势四联

还有一张?在垃圾桶里
一、获取数据
上次写了篇爬取假吃强视频评论并进行数据可视化处理的博客,有小伙伴质疑真实性,那么此次本人将对假吃强所有视频的标题和描述进行可视化处理
接口信息:获取UP主所有视频信息
参数:
- mid : UP主的编号
- pn : page number 页码
- ps : 每页显示的条数
此处为爬取假吃强所有视频信息的接口URL为:
https://api.bilibili.com/x/space/arc/search?mid=246534959&pn=1&ps=100
即爬取第一页视频的信息,共100条.使用Postman测试:
可以看见是没有问题的.接下来将所有视频信息爬取下来存入JSON文件中
def get_json(mid, pn, ps):
url = 'https://api.bilibili.com/x/space/arc/search?mid=%s&pn=%s&ps=%s' % (mid,pn, ps)
res = requests.get(url, 'utf-8')
# 将获取的数据转换为dict格式
data = res.json()
file_name = '%s-%s.json' % (mid, pn)
# JSON文件格式为uttf-8
with open('json/' + file_name, "w"