开篇
这个博客挂了两天,现在补上,首先是下载的链接手机评论,数据我保存成了json格式,我大概爬取了以下几个手机品牌的评论,由于京东一般过万的评论都只显示前一千多条,所以下面的每条都在一千条左右,我想正常的分析应该是足够了
这边的话,如果你想爬取其他商品的评论,也可以参照我的另外一篇博客,里面详细地介绍了爬取的过程,也放出了相应的代码,有兴趣的话可以自己尝试着实现一下,其实也就那么回事。
数据集
首先是数据集的读取
In [1]: import json
In [2]: with open('Desktop/手机评论数据集/oppo_r15.json','r') as f:
...: data = json.load(f)
看一下数据集里面都是一些什么内容<