情感分析是什么?
用户生成内容的爆炸式增长和档案材料的数字化创造了大量的数据集,其中包含了许多人对几乎每一个主题发表的观点。
在某些情况下,该数据的生成是通过用户界面构造的。例如,在电子商务网站上处理客户评论相对容易,因为用户需要在产品评论的文本旁边发布一个简单的评级。
然而,大多数数据都以非结构化形式提供。它没有一个标准的总结说“这个内容表达了一个积极的,消极的,混合的或中立的观点。”
例如,WordPress.com报道说,仅在2018年5月,博客作者们使用他们的平台发表了超过8700万篇文章。据YouTube首席执行官Susan Wojcicki介绍,每分钟都有超过400个小时的内容被上传到这个视频分享网站。同时,谷歌图书项目已经用400种语言数字化了至少2500万册
每当用户输入一个自由的文本框或对着麦克风讲话时,都需要一个推理来对情绪进行分类。
情感分析正是关注这一任务的领域。它是自然语言处理的一个分支,研究将文本文档映射到情感表达的功能。
随着准确的语音和文本识别的出现,情感分析的范围超出了容易理解的数字文本数据,并覆盖了越来越多的媒体。
我能用情感分析做些什么呢?
情感分析帮助我们了解过去,预测未来,并在现在采取适当的措施。
假设您有机会分析您的客户、竞争对手、学生或其他感兴趣的主题所表达的意见。你会用这些知识做什么?
这里有十个想法:
- 票房收入:Asur&Huberman(2010)在一个模型中包含了正面对消极情绪的比率,这个模型经过训练可以预测电影在票房发行前的票房收入。
- 品牌监测:Ghiassi等(2013)描述了一个系统,旨在监测表达关于品牌和名