使用工具
编程语言工具:Python 2.7 R 2 .2.1 excel
浏览器:Google Chrome
数据库: Mongodb
相关算法:情感分析
情感分析(Sentiment Analysis),又被称为倾向性分析、意见挖掘,是通过对带有一定的情感色彩的主观性文本进行处理分析,归纳推理的过程,例如通过用户对产品的性能、价格、便携性等方面的评价分析用户对该产品的情感倾向。通常来说,文本情感分析的目的是找出说话者在某些话题上或者针对同一事物的两极的观点的态度。或许是说话者当时的情感状态,抑或是作者有意向的情感交流。
情感分析的基本步骤是分类,即将文本传达的情感划分为不同的类别。在句子级、功能级判断文字所阐述的观点是正面的,负面的,抑或是中性的。
实现过程:确定目标网站
通过在大众点评网站查找并确定目标商家,进入其评论页面(https://www.dianping.com/shop/5144193/review_more?pageno=)。
对目标网站结构进行解析:利用浏览器自带的解析工具查看评论在网页的前端代码中的位置。