Deep Biaffine Attention for Dependency Parsing

本文介绍了一种在基于图的依赖解析器中使用神经注意力和biaffine分类器的方法。作者将传统的注意力机制和标签分类器替换为biaffine注意力模型,以解决不定类别分类问题。通过BiLSTM的输出状态应用双仿射变换,实现了deep bilinear attention mechanism,提高了依赖解析的性能。
摘要由CSDN通过智能技术生成

Abstract

本文在一个简单的基于图的依赖解析器中使用神经注意,并使用biaffine分类器来预测弧和标签。将传统的基于MLP注意力机制和仿射标签分类器替换为biaffine注意力

Model

biaffine并不是双向性或MLP机制,而是使用一个仿射变化在单个LSTM输出状态 r r r预测所有类别的得分
若每个句子中有N个单词,包括根在内一共有d=N+1个词,每个词都需要得到一个分数 s i s_i si,因为句子中词的个数是不确定的,所以这是一个不定类别的分类问题。
为了解决上述不定类别的分类问题,本文采用两个MLP对BiLSTM的隐层输出向量进行重新编码: h i = M L P ( r i ) ; h j = M L P ( r j ) h_i=MLP(r_i);h_j=MLP(r_j) hi=MLP(ri);hj=MLP(rj),然后通过线性变化和双仿射分类器得到的结果就是deep bilinear attention mechanism

启示

  1. 本文主要的工作是提出了双仿射注意力机制,只能说太强了。
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

「已注销」

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值