- 类库整理
- jieba分词 github传送门
- Pyecharts 数据可视化展示 github传送门
- Wordcloud 词云 github传送门 或者 github传送门2
数据采集
- 来源说明:来自当乐游戏中心,为啥我不找腾讯的?我找不到。。。这个是api的形式,比较好处理。
- 爬取说明,直接利用requests请求链接,拿到部分有用的字段存储到数据库,我这里使用了mongodb,当然啥都可以,存储文件也行。
- 存储需要的数据
接下来数据简单处理与输出
-
找出所有发言的设备数据,然后再寻找其手机品牌