小白学习ing
文章目录
前言
旅游大数据的数据采集模型和数据分析系统,以六安市旅游景点为例,采集携程网站上游客对景点的评价。对数据进行情感分类后,得到情感分析机器学习的数据集,进而训练情感分析模型。用训练好的模型制作简单的问答系统,实现对用户输入的文本进行情感预测。不仅如此,将六安市景点的数据进行简单的数据分析,包括热门景点分析、时间趋势分析和关键字词频统计。
GitHub地址:LSTM-DataAnalysis,欢迎下载指正!
一、思维导图
二、过程
1.数据的采集与存储
我尝试了两个方法。
方法一是使用八爪鱼采集器。下载后直接使用即可,输出为csv文件。
方法二是采用 Selenium 和 Chrome 浏览器自动化工具。
GitHub地址:Spider_Xiecheng_Comments
-
1.1版本问题
- chromedriver 和 chrome 浏览器的版本需要对应。我的代码中有 chromedr