根据id 隐藏_[论文解读] 2019 BiDirectional Interrelated SF-ID

最新推荐文章于 2021-10-10 23:09:56 发布

weixin_39668496

最新推荐文章于 2021-10-10 23:09:56 发布

阅读量165

点赞数

文章标签：根据id 隐藏

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39668496/article/details/112643753

版权

本文介绍了2019年提出的一种新型双向相互关联模型，用于联合意图检测和槽填充任务，特别是在ATIS数据集上取得领先性能。模型利用注意力机制整合上下文信息，并通过迭代机制增强ID和SF的信息交互。

摘要由CSDN通过智能技术生成

A Novel Bi-directional Interrelated Model for Joint Intent Detection and Slot Filling

只讲解不给代码的人，都是耍流氓

一、介绍

该论文中提出了一个基于Attention的联合模型，能够加强Slot Filling 和 Intent Detection 之间的有向连接，当时在ATIS数据集上取得了SOTA的效果。

注意这里是有向连接，因此也是有双向连接。因为SF和ID之间是存在相互依赖关系，单向依赖和双向依赖都能够加强信息建模。

二、模型

2.1 整合上下文信息

在SF任务中，每个token的标签不仅与单词具体语法和词法信息有关，也与文本的上下文有关。与上下文有关不仅在这里有重要的应用，在其他任务中基本上都有其应用，毕竟根据文本判定其含义才是语言的精髓。

而如何根据上下文获取有效信息呢？注意力机制是一个非常好的建模工具。

2.2 Slot Attention

在SF模块中，上下文信息获取的

如图所示，左边是一个BiLSTM模型，用于在输入文本中提取特征。而Attention机制与Attention-Based Recurrent Neural Network Models for Joint Intent Detection and Slot Filling一致，具体细节请看此论文。

2.3 Intent Attention

IntentDetection的上下文向量的计算方法与SF是一致的，那也就说明 shape(

) = shape(

)。虽然获取方法是一致的，可使用的渠道不一样，为两个独立的注意力机制，提取的特征是不一样的。

三、SF-ID网络架构

前面提到过SF subnet和ID subnet自网络是有向连接，也就会存在SF-First和ID-First这两种模式。前一个网络会将输出的隐藏层信息传递给后一层，这样就会建立一种依赖性关系。

3.1 `SF-First`

在这种模式中，SF subnet会先执行，过程如下：

在SF subnet中将
和

作为输入，生成加强版的

向量，
使用CRF和
来做序列标注任务，完成槽填充这个自任务。

3.

最低0.47元/天解锁文章

weixin_39668496

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。