ACL'22 | 西湖大学提出:面向Aspect情感分析的离散意见树归纳方法

outside_default.png

作者: 周婷
方向: 情感分析
学校: 中山大学

outside_default.png

论文:Discrete Opinion Tree Induction for Aspect-based Sentiment Analysis

单位:西湖大学、苏州大学

地址:https://aclanthology.org/2022.acl-long.145.pdf

「文章贡献」

在本文中,我们探索了一种简单的方法,为每个方面自动生成离散意见树结构。用到了RL。

outside_default.png

首先为每个方面生成离散意见树,设方面词的位置为[b,e],则首先将方面跨度[b, e]作为根节点,然后分别从跨度[1,b−1]和[e+1, n]构建它的左子节点和右子节点。为了构建左子树或右子树,我们首先选择span中「得分最大的元素」作为子树的根节点,然后递归地对相应的span分区使用build_tree调用。(除了方面词外其他node都是单个词)。

关于得分分数的计算,选择将" "作为BERT的输入得到特殊于方面词的句子表达H,然后按照如下计算得分:

outside_default.png

其中h是H中方面词部分的平均池化,构建树的这部分包含的参数有三个以及BERT参数部分。

构建树的这一部分称为,输入为x和a(用于打分),输出为一棵树,参数 ϕ 包括上述参数。这一部分参数使用RL进行更新而不是最终损失函数的反向传播。

生成树以后开始正式执行预测任务,模型非常简单。

将上面得到的树生成邻接矩阵,经过GCN(可能多层),取最后一层GCN的输出结果的方面词部分以及[CLS]这个token的表达之和作为query,与GCN的输入的初始向量特征(也就是原句子经过句子编码器得到的)做注意力机制,用输入去表达最终的方面级分类特征。

outside_default.png

最后输出分类结果

outside_default.png

损失函数:

outside_default.png

注意这个论文分为两个模块,第一个是生成树,利用得到t;第二部分是预测, ,这里的 θ 包括GCN模块的参数和输出(等式5)的部分,PS注意力模块没有引进参数哦。

第二部分使用上述损失函数进行优化,由于树的采样过程是一个离散的决策过程,因此它是不可微的,第一部分使用的是RL进行优化。

强化学习实现训练部分还没看。

实验效果和分析

outside_default.png
MAMS 开发集效果
outside_default.png
在MAMS数据上和多语言评论数据的结果
outside_default.png
SemEval数据集上的效果
outside_default.png
和span-based RL作对比

图3a和图3b分别显示了方面术语“scallops”的induced tree和dependency parse:

outside_default.png

图4a和图4b显示了两个情绪极性不同的方面术语的induced tree:

outside_default.png

aspect 和 opinion word的距离分析:outside_default.png

基于MAMS的测试集分类精度与训练集中各方面频率的关系:outside_default.png


📝论文解读投稿,让你的文章被更多不同背景、不同方向的人看到,不被石沉大海,或许还能增加不少引用的呦~ 投稿加下面微信备注“投稿”即可。

最近文章

COLING'22 | SelfMix:针对带噪数据集的半监督学习方法

ACMMM 2022 | 首个针对跨语言跨模态检索的噪声鲁棒研究工作

ACM MM 2022 Oral  | PRVR: 新的文本到视频跨模态检索子任务


投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。

方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

outside_default.png

记得备注~

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值