Merging Statistical Feature via Adaptive Gate for Improved Text Classification,AAAI2021

在这里插入图片描述
文本分类研究主要集中在仅利用文本输入来训练分类器,或通过引入外部知识(如手工词汇和领域知识)来增强语义特征。相比之下,语料库的一些固有的统计特征,如词频和标签分布,没有得到很好的利用。与外部知识相比,统计特征具有确定性,自然与相应的任务相容。在本文中提出了一种自适应门网络(AGN)来选择性地利用统计特征巩固语义表示。AGN可以与现有的文本分类模型进一步结合,并提升模型的性能。

Methodology

在这里插入图片描述

Global information

为了利用与标签相对的单词的频率等固有信息,本文首先提出了一个term-count-of-labels(TCoL)定义:
在这里插入图片描述
ζ i \zeta_i ζi表示单词 w w w在标签 i i i的文本中出现的数量,所以给定一个句子 s s s,会有一个统计信息的矩阵:
在这里插入图片描述
如果单词 w w w在所有标签上的频率很高或很低,那么我们可以假设 w w w对分类任务的贡献有限。相反,如果一个词在特定的标签类中出现得更频繁,假设这个词是携带特殊信息的。注意,TCoL字典 V V V仅从训练集获得,防止信息泄露。

V-Net: Variational Encoding Network

之后,为了更好得获取标签单词相关矩阵得稠密表示,本文使用了一个变分自编码器将离散的 ζ \zeta ζ映射到连续空间。对于语料中的所有句子,可以得到所有句子的TCoL矩阵,用 Z = { ζ i s } i = 1 N Z=\{\zeta^s_{i}\}_{i=1}^N Z={ζis}i=1N表示,由 N N N个独立同分布的TCoL矩阵组成。假设所有的TCoL向量都是由 p θ ( ζ ∣ z ) p_{\theta}(\zeta|z) pθ(ζz)生成的(解码器),其中潜变量 z z z从一个先验分布 p θ ( z ) p_{\theta}(z) pθ(z)采样而来。但是 p θ ( z ) p_{\theta}(z) pθ(z)并不已知,因此使用 p ϕ ( z ∣ ζ ) p_{\phi}(z|\zeta) pϕ(zζ)(编码器)对 p θ ( z ) p_{\theta}(z) pθ(z)进行估计。其损失函数包含两部分:
在这里插入图片描述
后者(期望)是重构误差,目的是让生成数据和原始数据尽可能相近;KL散度是正则项,它衡量了两个分布的近似程度。之后,采用重参数的方式重新定义后验(因为离散的后验采样并不可微分):
在这里插入图片描述
最终,训练好的VAE可以通过编码部分得到 ζ z \zeta^z ζz,这是单词-标签之间特征的稠密表示。尽管VAE的推导过程十分复杂,但是代码却十分简单。

S-Net: Semantic Representation Projection Network

S-Net通过LSTM或是语言模型抽取 s s s的特征,并进行映射:
在这里插入图片描述
在这里插入图片描述

Valve Component

之后是VAE的输出与 H C H^C HC的结合,在那之前还需要对 ζ z \zeta^z ζz做一个变换:
在这里插入图片描述
之后,借助AdaGate与S-Net获取的特征进行聚合:
在这里插入图片描述
其中 H ′ C = σ ( H C ) H'^{C}=\sigma(H^C) HC=σ(HC),用于评估决策过程中相应语义特征的置信度。Valve函数被设计用来恢复不太可信的条目,比如预测概率更偏向于0或者1则是置信度高的预测,偏向于0.5则是置信度低的:
在这里插入图片描述
ϵ \epsilon ϵ是一个用于控制丢弃量的参数。最终,使用一个注意力将AdaGate的输出与原始Bert的输出进行聚合:
在这里插入图片描述

Experiment

数据集:
在这里插入图片描述
实验结果(+S/A表示直接在Bert等模型的输出特征上使用self-attention):
在这里插入图片描述
在这里插入图片描述
不同 ϵ \epsilon ϵ值的探究:
在这里插入图片描述
不使用统计信息以及使用相关信息对模型注意力的影响:
在这里插入图片描述
随机扰乱TCoL对最终效果的影响:
在这里插入图片描述
VAE与AE的比较:
在这里插入图片描述

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

五月的echo

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值