Fusion Convolutional Attention Network for Opinion Spam Detection(ICONIP 2019)

Fusion Convolutional Attention Network for Opinion Spam Detection(ICONIP 2019)

contribution:

  1. 本文设计了一个层次化网络来自动学习语义表达和用户信息。不需要手动设计特征并且不受数据集限制
  2. 本文提出了融合注意力集之来融合user-word和user-sentence特征
  3. 实验表明本方法在四个数据集上取得了较大的提升

模型:

D:review dataset

U:user’s meta datas

分类函数:![C:\Users\94205\AppData\Roaming\Typora\typora-user-images](https://img-blog.csdnimg.cn/2020083015340468.png#pic_center)

3.1user representation

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

3.2text representation

作者将每个文档分成L个句子,每个句子包含T个词。首先使用卷积核在这里插入图片描述
在这里插入图片描述

一个句子得到的表达为:
在这里插入图片描述
在这里插入图片描述

然后用m个filter得到多个feature vectors在这里插入图片描述

3.3word-user fusion attention layer

为了在word level学习user-aware的文本表达,作者提出word-user fusion attention来把用户信息结合到word-level的向量

在这里插入图片描述
在这里插入图片描述

是T-h+1份user representation的copy。$W_e \in R^{m \times m},W_u \in R^{m \times m} $是权重矩阵,然后我们得到了user-ware的word representation Z ∈ R ( T − h + 1 ) × m Z \in R^{(T-h+1) \times m} ZR(Th+1)×m.

从用户的角度来看,不是所有的单词对于用户的偏好反应都是相等的,因为用attention layer来捕捉不同词的重要程度。

在这里插入图片描述

where W z ∈ R m × n W_z \in R^{m \times n} WzRm×n, V ∈ R ( T − h + 1 ) × n V \in R^{(T-h+1) \times n} VR(Th+1)×n是学习的参数, v w ∈ R n × 1 v_w \in R^{n \times 1} vwRn×1是一个context vector。训练过程中这个词向量的初始化是随机的并且是同时学习的。最后得到句子向量 s ( h ) ∈ R m s^{(h)} \in R^m s(h)Rm是不同word representation的加权表达

CNN重我们设置卷积核大小 h ∈ 3 , 4 , 5 h \in {3,4,5} h3,4,5,因此得到在这里插入图片描述
,where s ∈ R 3 m s \in R^{3m} sR3m

3.4 sentence-user fusion attention layer

经过句子编码之后,文档矩阵可以被表示为在这里插入图片描述

为了加强用户信息的影响,sentence-aware fusion attention用于抓取user-aware的重要句子并通过加权求和得到文档表达。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
是权重矩阵, M ∈ R L × m M \in R^{L \times m} MRL×m是S的hidden representation, v ∈ R m × 1 v \in R^{m \times1} vRm×1是context vector

3.5 spam classification

在这里插入图片描述

loss function
在这里插入图片描述
overall loss function

在这里插入图片描述
4.实验

数据集介绍:
在这里插入图片描述

与baseline对比

在这里插入图片描述
在这里插入图片描述

ablation study

在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值