【论文笔记05】WORDS OR CHARACTERS? FINE-GRAINED GATING FOR READING COMPREHENSION

最新推荐文章于 2023-09-05 13:17:37 发布

闰土不用叉

最新推荐文章于 2023-09-05 13:17:37 发布

阅读量457

点赞数 1

分类专栏：笔记论文笔记自然语言处理小NLPer渣渣的被虐日记文章标签：阅读理解文本特征表示 gate

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xyz1584172808/article/details/83278043

版权

自然语言处理同时被 3 个专栏收录

31 篇文章 5 订阅

订阅专栏

21 篇文章 0 订阅

订阅专栏

15 篇文章 0 订阅

订阅专栏

1 问题和数据集

1.1 问题

这是一篇以阅读理解为任务的文章，但在具体处理这个任务时，主要解决数据特征等的表示问题。在提取文本特征时，通常只对单词做词嵌入，而忽略了字符级的特征。

1.2 数据集

CBT
WDW
SQuAD

2 目前已有方法

2.1 单词级表示

（1）from a lookup table
（2）每个单词用一个向量表示
（3）擅长表示单词的语义

2.2 字符级表示

（1）在单词的字符序列上运用RNN或者CNN，隐层状态合并来形成字符表示
（2）更适合子词形态建模
（3）可以减轻模型的OOV问题

2.3 单词级和字符级结合

（1）组合例子

C2W model based on bidirectional LSTMs
gate units（Miyamoto & cho等提出的标量门控条件实际上并未提高性能）

（2）面临问题

对于频繁单词，可以准确估计，加入字符级表示可以产生干扰；
对于非频繁词，加入字符级会带来负面影响

3 本文提出的方法

本文提出了一个细粒度门控机制来合并单词级和字符级表示

4 具体内容

4.1 特征融合

特征融合示意图
step1：对于单词特征，先做one-hot编码，再做word-embedding作为单词级表示（记为hp）
step2：对于字符特征，对单词里的每个字符做one-hot，再送人RNN，得到最后隐层向量来作为字符级表示（记为hq）
step3：利用NER,POS,Frequency特征等拼接而得到v，用来计算门控单元g。
门控g的计算

step4：将两个特征用门控机制来融合
特征融合

4.2 检索答案

检索答案示意图
step1：计算Iij，于是qj可以看成是过滤Pi中的信息

step2：计算hi，相当于在Iij上运用一个注意力机制，从而得到输出hi。（wi和wj分别是pi和qj的one-hot编码，原因是加强匹配，当k的值非常大时，这样的信息并不是完全保留。）

5 小结

（1）.这是一个新的文本特征表示方法，当g值较大时，更多的信息流来自字符级，当g的信息较小时，更多的信息流来自单词级；
（2）本文使用的细粒度的门控机制，采用的是向量门而不是标量门；并且根据特征来设置门，能够更好的反映单词的属性

资料来源

论文代码

https://github.com/kimiyoung/fg-gating

参考论文笔记

https://zhuanlan.zhihu.com/p/43554818

闰土不用叉

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。