绪言
伴随着电子商务的飞速发展,网络购物已经成为了大众主流的购物方式,随之而来的是用户在购物网站发表了大量的评论。对这些评论文本进行情感分析对于研究用户反馈、进行商品推荐等具有十分重要的意义。
但是由于互联网平台的自由性,以及部分商家的恶意竞争,互联网中充斥了大量的恶意评论。然而,一种新颖的面向用户的问答型评论方式出现在诸如淘宝、京东和亚马逊等各大电商平台上。相比如传统的方式,这种问答型的评论方式能更大程度上避免虚假评论,并且用户的回答更可信、更具体。
数据集收集及标注
苏州大学团队从淘宝的美妆、数码以及鞋子三个领域的问大家模块中各收集了10000条左右的数据,并标注为4种类型: positive, negative, conflict (既含有积极情感又含有消极情感) and neutral (既不是积极的也不是消极的)
提出模型
针对问答型文本方面和情感包含在不同语句的特性,该团队提出了一种专门的方案即分层匹配网络(Hierarchical Matching Network)
该模型将问题和回答分别进行HTML编码以后,相乘,得到二者的交互性,然后分别采用列优先和行优先的注意力机制从而得到问题对于答案的重要程度和答案对于问题的重要程度。
但是这种情况也存在一个问题,就是会存在无效的问题和答案的文本对,因此在2019年他们团队结合了强化学习在此基础上又提出了一个新的模型。
利用强化学习对问题-答案文本对进行选择从而将无效对的注意力分数降低为0,从下图也可以看出其效果明显。
展望
目前比较大的问题就是数据的获取、清洗以及不平衡的问题。
参考文献
[1]基于双向注意力机制的问答情感分类方法
[2]Sentiment Classification towards Question-Answering with Hierarchical Matching Network
[3]Aspect Sentiment Classification Towards Question-Answering with Reinforced Bidirectional Attention Network