作业介绍
作业目标 | Python爬取腾讯视频《在一起》评论,利用分词器处理数据,生成词云,将代码上传到Github |
---|---|
作业源代码 | 第一次个人编程代码 |
时间记录
步骤 | 具体做法 | 时间 |
---|---|---|
1. 进行数据采集 | 采集腾讯视频里电视剧《在一起》的全部评论信息 | 2h |
2.进行数据处理 | 把所有数据下载到本地保存到json文件里面comments.json, 页面用js读取文件 | 5h |
3.数据分析展示 | 将采集到的评论信息做成词云图 | Nh |
4.代码上传到Github | 上传到Github | 30min |
代码介绍
1.Python爬虫
前言
在某些网站 ,当我们滑下去的时候才会显示出后面的内容,就像淘宝一样,滑下去才逐渐显示其他商品,这个就是采用 Ajax 做的,然后我们现在就是要编写这样的爬虫。