机器学习即服务:关于情感分析的10个应用场景和4个服务

情感分析是什么?

用户生成内容的爆炸式增长和档案材料的数字化创造了大量的数据集,其中包含了许多人对几乎每一个主题发表的观点。

在某些情况下,该数据的生成是通过用户界面构造的。例如,在电子商务网站上处理客户评论相对容易,因为用户需要在产品评论的文本旁边发布一个简单的评级。

然而,大多数数据都以非结构化形式提供。它没有一个标准的总结说“这个内容表达了一个积极的,消极的,混合的或中立的观点。”

例如,WordPress.com报道说,仅在2018年5月,博客作者们使用他们的平台发表了超过8700万篇文章。据YouTube首席执行官Susan Wojcicki介绍,每分钟都有超过400个小时的内容被上传到这个视频分享网站。同时,谷歌图书项目已经用400种语言数字化了至少2500万册

每当用户输入一个自由的文本框或对着麦克风讲话时,都需要一个推理来对情绪进行分类。

情感分析正是关注这一任务的领域。它是自然语言处理的一个分支,研究将文本文档映射到情感表达的功能。

随着准确的语音和文本识别的出现,情感分析的范围超出了容易理解的数字文本数据,并覆盖了越来越多的媒体。

我能用情感分析做些什么呢?

情感分析帮助我们了解过去,预测未来,并在现在采取适当的措施。

假设您有机会分析您的客户、竞争对手、学生或其他感兴趣的主题所表达的意见。你会用这些知识做什么?

这里有十个想法:

  • 票房收入:Asur&Huberman(2010)在一个模型中包含了正面对消极情绪的比率,这个模型经过训练可以预测电影在票房发行前的票房收入。
  • 品牌监测:Ghiassi等(2013)描述了一个系统,旨在监测表达关于品牌和名人的情绪的推文。
  • 计算历史:Acerbi(2013)使用20世纪出版的书籍档案生成了一系列时间序列的积极和消极情绪。
  • 顾客反馈:Gamon(2005)在顾客调查和知识库中提供的反馈的背景下探讨情感分析。
  • 退出率:Wen et al. (2014年)使用在大型开放式在线课程(MOOC)论坛中表达的观点来预测消耗,并可能相应地进行干预。
  • 监测政治情感:Abbasi et al。(2008)分析极端主义团体论坛的政治情感。
  • 产品评论:在他的经典论文中,Turney(2002)将情绪分析应用于不同类型产品和服务的在线评论。
  • 股市预测:Bollen等。(2011年)包括对预测道琼斯工业平均指数变化的模型中公众情绪的估计。
  • 故事情节:里根等人。(2016)使用情感挖掘来确定古腾堡工程小说集合中情感轨迹的基本形状。
  • 情绪分析作为一项子任务:庞和李(Pang&Lee,2008)提到情绪分析是高阶系统的一个组成部分。例如,总结可能会从包含对某一特定主题表达不同意见的来源中受益。

我必须提供什么?我得到什么回报?

我们说过,情绪分析以文本作为输入,以情绪的表示作为输出。

关于输入几乎没什么可说的。这是你想要分析的书/评论/客户调查/电子邮件/新闻文章/产品评论/tweet或其他类型的文档的文本内容。

现在,让我们讨论输出。

二元情感分析

二元情感分析,最简单的情况,要求以下问题:“文本文件中所表达的观点是积极的还是消极的?”

在这里,输出是一个概率或得分。让我们首先考虑概率。

高概率表示给定的文本可能表达积极的意见。例如,0.9的输出表明90%概率表达意见是积极的。

相反,低概率表明给定的文本很可能是一个否定视图的表达式。例如,输出0.1表示该观点是正面的概率为10%,换句话说,表示负面意见的文档的概率为90%。

或者,情感的预测也可以用分数来表示。积极的分数表示积极的情绪。消极的分数代表消极的情绪。更高的绝对值意味着更强的情绪。

多元情绪分析

在多元情感分析中,输出是n个可能类的概率分布。换句话说,输出是n个非负数加起来为1的列表。

二元情感分析是多情感的特殊情况,有n = 2。

二元情感分析的简单扩展是引入中立意见的类别,作为积极和否定意见的替代。在这种情况下,输出是三个概率的列表,加起来是1 (n = 3)。例如,3个概率可以排序为:负概率、中立概率和正概率。

假设客户发布了一个混合的评论,列出了产品的积极和消极方面。情感分析器的输出可以是这样:[0.4,0.1,0.5]。换句话说,预计文本表达的正面观点比负面的观点多一些,而中立的观点则少一些。

另一个可能的扩展是包含一个混合类别。假设我们将这四种分类归为:负的、中性的、混合的、正的。混合产品评审示例中的输出可能如下所示:[0.15、0.05、0.7、0.1]

  • 3
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值