Multi-Task-DNN(2019ACL)

在这里插入图片描述

  Multi-Task Deep Neural Networks for Natural Language Understanding
  https://github.com/namisan/mt-dnn.

Model

在这里插入图片描述

Lexicon Encoder ( l1):

输入 X X X = { x 1 x_1 x1,…, x m x_m xm}, m m m个token,X可以是单个句子,也可以是多个句子的打包
首个token:[CLS]
句子分割:[SEP]
embedding:word, segment, and positional embeddings的加权

Transformer Encoder (l2):

多层biTransformer encoder将输入表示向量映射到一系列上下文嵌入向量:
C C C ∈ ∈ R R R d ^d d × ^× × m ^m m
这是不同任务之间的共享表示。与BERT不同,MT-DNN除了预训练之外,还使用多任务目标学习表征。

Multi-task layer:

Single-Sentence Classification Output:

x x x表示[ C C C L L L S S S]位置的上下文embedding(可以看作是句子 X X X的整体语义表示)
逻辑回归预测:
在这里插入图片描述

Text Similarity Output:

在这里插入图片描述

Pairwise Text Classification Output:

自然语言推理为例:
前提 P P P={ p 1 p_1 p1,…, p m p_m pm}
假设 H H H={ h 1 h_1 h1,… h n h_n hn}
关系 R R R
输出模块和stochastic answer network(SAN)方法一样:
在这里插入图片描述
首先通过连接 P P P中单词的上下文嵌入来构建前提 P P P的working memory, P P P是Transformer encoder的输出,表示为 M p M^p Mp ∈ ∈ R R R d ^d d × ^× × m ^m m,类似地,假设 H H H的working memory,表示为 M h M^h Mh ∈ ∈ R R R d ^d d × ^× × n ^n n。然后,对记忆执行 K K K步推理以输出关系标签,其中 K K K是超参数。在开始,初始状态 s 0 s_0 s0 M h M_h Mh的总结:
= P jαjMh j,

其中
在这里插入图片描述

在{ 1 1 1 2 2 2,…, K K K − - 1 1 1 }范围内的时间步长 K K K,state由
sk = GRU(sk 1,xk)

定义。这里, x k x^k xk根据先前的状态 s s s k ^k k − ^- 1 ^1 1和memory M p M^p Mp计算:
xk = P jβJmp jandβj = soft max(sk 1W > 2MP)。
β j β_j βj= s s s o o o f f f t t t m m m a a a x x x( s s s k ^k k − ^− 1 ^1 1 W W W T ^T T M p M^p Mp)

单层分类器用于确定每个步骤 k k k:
在这里插入图片描述
最后,通过平均分数来利用所有的 K K K个输出:

在这里插入图片描述

Relevance Ranking Output:

QA问题:
在这里插入图片描述

The Training Procedure

Train 两个过程:

  1. pretraining(shared layer encoder):Mask和NSP
  2. multi-tsak learning:通过具体tsak训练:
    分类(交叉熵)
    在这里插入图片描述

text similarity tasks(MSE)
在这里插入图片描述
relevance ranking tasks:(negative log likelihood)
A + A^+ A+是正例, A A A是候选列表, l l l a a a m m m d d d a a a = 1
在这里插入图片描述

实验

在这里插入图片描述
GLUE test set results:
在这里插入图片描述
在这里插入图片描述
领域适用:
在这里插入图片描述
Results on the SNLI and SciTail dataset.
在这里插入图片描述

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值