NLP论文笔记

最新推荐文章于 2024-02-26 17:59:18 发布

数学编程

最新推荐文章于 2024-02-26 17:59:18 发布

阅读量412

点赞数

分类专栏：机器学习算法文章标签：神经网络深度学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42060232/article/details/109768986

版权

本文整理个人读论文的一点心得，分享其中有意思的论文观点，主要作为学习笔记，如果能够对读者有帮助，那就更好了。

本文主要关注注意力机制。注意力机制最早在2014年出现在CV领域¹，之后Bahdanau，Bengio等人将这种机制运用到自然语言处理领域²，开创了基于注意力机制刷榜NLP各类任务的时代。既然注意力机制这么牛皮，那为什么不直接使用呢？于是Vaswani,Shazeer,Kaiser等人³直接抛弃了RNN，提出了自注意力机制，这就是后来的Transformer架构。之后沿着Transformer这条路发展的预训练模型就一发不可收拾了。

Bahdanau等人最早引入了注意力机制，采用的是双向RNN作为编码层，解码层采用单向的RNN。既然RNN可以添加注意力机制，那么CNN应该肯定也可以（NLP领域使用CNN）。

ABCNN基于CNN的注意力

ABCNN（Attention-Based Convolutional Neural Network），2018年Wenpeng Yin, Hinrich Sch¨utze等人做了尝试⁴.做的是Answer Selection(AS)

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
NLP论文笔记

本文整理个人读论文的一点心得，分享其中有意思的论文观点，主要作为学习笔记，如果能够对读者有帮助，那就更好了。本文主要关注注意力机制。注意力机制最早在2014年出现在CV领域1，之后Bahdanau，Bengio等人将这种机制运用到自然语言处理领域2，开创了基于注意力机制刷榜NLP各类任务的时代。既然注意力机制这么牛皮，那为什么不直接使用呢？于是Vaswani,Shazeer,Kaiser等人3直接抛弃了RNN，提出了自注意力机制，这就是后来的Transformer架构。之后沿着Transformer这条路
复制链接

扫一扫

专栏目录

数学编程 CSDN认证博客专家 CSDN认证企业博客

码龄6年

20: 原创

15万+: 周排名

94万+: 总排名

2万+: 访问

: 等级

283: 积分

5: 粉丝

21: 获赞

3: 评论

70: 收藏

私信

关注

分类专栏

分词 1篇
词云图 1篇
机器学习 9篇
算法 9篇
图解算法 5篇
python 10篇
数学 2篇

最新评论

图文理解自注意力(self-attention)
每日的坚果: 很好的文章！简单有效的代码往往能理解更深刻
图文理解自注意力(self-attention)
小小兔与胖虎虎: 找了几天，只有博主把这个机制讲清楚了。
PyTorch预训练Bert模型
CCXS: 请问数据集下载不下来是什么原因啊，报错是因为打不开网站

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。