作者:Aadit Barua(NLP 爱好者、TowardsDataScience 作者)
译者:LZM
原文:Product Feature- vs. Review-Level Sentiment Analysis: When the Parts are Worth More than the Whole
情感分析是自然语言处理 (NLP) 的一个关键任务,其有效性取决于它能够提供对客户偏好的洞察。能否就公司的产品或服务提供详细的指导和建议,取决于我们在特征或属性级别上进行情感分析的能力。
在本文,我们设计并测试了一种简单的情感分析方法,该方法将顾客对商品或服务的评论细分为若干特征进行分析。
该方法的动机是,顾客可能在一篇评论评价一个产品的多个特征,并且对每个特征流露的情感可能不一致。例如,你可能喜欢一款头戴式耳机的音质,但对其降噪效果颇有微词。
这时,在整篇评论上进行情感分析可能导致不正确的结果,即把对产品某个方面的态度视为对整体的态度。因此,我们首先抽取每个特征对应的评论文本,然后分别对每个特征进行情感分析,而不是直接在整篇评论上做情感分析。通过分析运动鞋的评论,我们为每个特征建立情感分数,实验证明我们的方法能取得更低的误差。
为什么要关心特征级情感?
情感分析在自然语言处理的应用中扮演至关重要的角色,包括推荐系统和理解用户对品牌和产品的意见。评论通常涉及多个特征或属性。表 1 给出一些例子。
表 1. 频繁出现的商品及其特征
一般,情感分析直接应用于全篇评论。然而,全文情感分析可能不能正确分析每个特征的情感。表 2 展示了一些例子,其中特征被用粗体标出。