论文浅读-Latent Opinions Transfer Network for Target-Oriented Opinion Words Extraction

本文介绍了一种名为LOTN的模型,通过从大量评论情感分类中迁移潜在观点知识,解决TOWE任务中数据稀缺问题。该模型结合了情感分类模块和TOWE模块,利用注意力机制和辅助学习信号提高观点词抽取的准确性。实验结果表明,这种方法在Yelp和Amazon数据集预训练后,能在SemEval数据集上有效提升性能。
摘要由CSDN通过智能技术生成

论文浅读


(AAAI-20)Latent Opinions Transfer Network for Target-Oriented Opinion Words Extraction


链接:https://aaai.org/ojs/index.php/AAAI/article/view/6469
论文下载地址


动机

从2019年作者Fan在论文 Target-oriented Opinion Words Extraction with Target-fused Neural Sequence Labeling 中定义了 TOWE(Target-oriented Opinion Words Extraction)任务,旨在从评论文本中抽取给定意见目标(opinion target)对应的观点词(opinion words)。 考虑到标注大量细粒度情感分析数据是耗时且困难的,这篇论文提出了从迁移学习的角度出发,提出潜在观点迁移网络,从资源丰富的评论情感分类中迁移潜在的观点知识来提升TOWE。 添加了一个评论情感分类模块,这个模块运行了两次,第一次是模型训练之前,先用情感分类模块训练大型的评论数据集,预训练结束后,情感分类模块中所有的参数固定。第二次运行是在训练时,用来获取输入的sentence中的意见词。

亮点

  1. 在解决注释数据不足的问题上,作者首次提出将潜在的观点知识从资源丰富的评论情绪分类数据集转移到TOWE的低资源任务中。
  2. 为了有效地传递意见信息,作者出了一种新的模型,从情感分类模型中提取潜在的意见词,并通过辅助学习信号将其整合到TOWE中,提升TOWE模型的性能。

概念及模型

TOWE目标是从一个句子中抽取给定目标对应的意见词,具体来说,给定由n个单词组成的评论句子s = {w1,w2,wn}和句子s中的意见目标wt1(注意,为了简单起见,我们没有将意见目标表示为一个单词。当给定不同的意见目标时,句子的不同标注结果。意见目标用下划线突出显示,意见词/短语用粗体显示。
在这里插入图片描述
潜在意见转移网络(LOTN):
潜在意见转移网络LOTN模型
如上图所示,该论文提出将基于注意力的情感分类模型中提取的潜在意见词通过辅助学习模块整合到TOWE中,以提升TOWE的性能。
模型思路:首先,通过评论情感分类模块,使用Yelp等大型评论数据集进行训练,训练结束后,情感分类模块所有参数保持不变(这里体现了迁移学习思想,使用其他模块的数据集来训练模型)。其次,提出了模型LOTN,在模型运行时,同一个句子分别输入TOWE模块和情感分类模块,情感分类模块通过基于注意力机制的bilstm找到可能存在的意见词(目标无关)。提出了一种转移方法识别潜在的目标相关的意见词。又提出了一种辅助学习方法将识别到的潜在目标相关的意见词转移到TOWE中。最后通过解码层进行序列标记任务。
情感分类模块预处理:评论情感分类旨在检测评论文本的总体情感极性(例如,正面或负面)。在传递潜在观点之前,首先在大规模评论情感分类数据集上预处理一个基于注意力的BiLSTM模型。注意机制用于捕获潜在的和全局的对情感分类有意义的意见词。预训练结束后,该模型参数保持不变。注意力权重αi计算如下:

注意力权重
其中hscavg 表示为所有隐藏状态的平均值,u() 进行线性变化,转化为一个数,好计算注意力权重。
TOWE模块:基于位置嵌入的Bi-LSTM,输入的单词 wi 的表示 ei 由字向量和对应该位置的位置向量串联而成: ei=[Eemb(wi):Epos(li)] , li=|i-t| ,每个单词到目标词的相对距离,通过Bi-LSTM捕捉每个单词的上下文信息hti
情感分类模块:为了转移潜在的观点知识,将任务的句子s输入到预训练的情绪分类模块,生成对应的隐藏状态 {hsc1,hsc2,…,hscm} 和注意力权重 12,…,αn} 。然后通过连接把两个隐藏状态进行整合 ri=[hti:hsci],这里的 ri 即包含了任务特定的上下文信息,也包含了来自情感分类模块的外部opinion知识.
转移潜在的观点词(情感词)方法:

  1. Transformation Method:情感分类模块中的注意力机制以概率权重的方式捕捉潜在的意见词(与目标无关),作者通过目标和相关距离权重 ci 将目标信息引入到注意分布中:在这里插入图片描述
    然后归一化处理,设置一个阈值 1/n,得到和目标相关的观点词。
    在这里插入图片描述
    在这里插入图片描述

  2. 辅助学习信号:通过辅助学习信号将这些潜在的观点知识整合到TOWE模块中,这里的 La 就表示的是辅助学习信号。在这里插入图片描述
    LOTN损失函数:最终的损失函数定义如下:
    在这里插入图片描述
    其中 Lt 是TOWE的损失函数:
    在这里插入图片描述


实验

Yelp Review 和 Amazon Review 用于预训练情感分类模块,
SemEval 2014 , SemEval 2015, SemEval 2016用于TOWE模块训练
在这里插入图片描述
结果:
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值