项目总进度
1.实现了对全网多个平台如知乎、bilibili、观察者网、今日头条等数据的爬取。
2. 构建了相对简易的前端页面及词云的展示
3. 对已爬取的数据进行了简单的数据的预处理
4. 对已爬取的数据使用深度学习的方法预测情感倾向并标注情感标签
6月5日
- 初步爬取了头条的数据。
- 做了简易的前端可视化界面。
- 初步讨论确定了训练使用的模型,即在已有数据集的基础上使用神经网络进行训练学习,使用模型时然后会结合新的数据并在之前训练的模型的基础上对未来的数据进行预测分析。
6月6日
- 完成了一个头条爬虫接口的实现,可以做到调用该接口输入一个关键词即可爬取对应关键词实时数据的功能。
- 初步实现对微博数据的爬取。
- 后台的初步学习和搭建
6月7日
- 前端页面增加了根据数据的可视化词云展示。
- 初步实现了对知乎数据的爬取。
- 初步实现了对bilibili数据的爬取。
6月8日
- 使用深度学习的方法对已有数据的情感标签标注。
- 初步使用模型在已有数据的基础上进行训练
6月9日
- 模型的训练与调试
- 后台的搭建
6月10日
- 模型的训练与调试
- 后台的搭建
项目GitHub地址及成员博客地址
项目GitHub地址
<