声明
因原文格式比较乱,所以我按照自己的方式进行了整理。结果整理完之后才发现王树义老师的简书里面也同样有这篇文章,附上地址 https://www.jianshu.com/p/d50a14541d01 。若本文侵犯了您的权益,请随时与我联系,给您带来的不便还请谅解!
定义
文本情感分析(sentiment analysis)也称为意见挖掘,是指用自然语言处理、文本挖掘以及计算机语言学等方法来识别和提取原素材中的主观信息。
适用场景
商品评论挖掘、电影推荐、股市预测……
早在2010年,Jonhan Bollen 等人就在《Twitter mood predicts the stock market》一文中提出利用 Twitter 中的公开信息进行情感分析,以此来对股市的涨落做预测,准确率高达87.6%!并且他们认为,只要能获得大量实时社交媒体文本数据,并进行相应的情感分析就能保证得到较好预测效果。
当前,随着电子商务的飞速发展,我们可以获得的文本数据非常多,例如大众点评、豆瓣和亚马逊等等。
NLTK
Natural Language Toolkit,自然语言处理工具包,在NLP领域中,最常使用的一个Python库。NLTK由Steven Bird和Edward Loper在宾夕法尼亚大学计算机和信息科学系开发。
系统环境说明
本文的实验环境是 Python 3.6.1 |Anaconda 4.4.0 (64-bit),Win10
英文情感分析例子
工具
TextBlob
安装依赖包
pip install textblob
python