深度学习的Attention模型

最新推荐文章于 2024-08-18 12:02:19 发布

超人汪小建(seaboat)

最新推荐文章于 2024-08-18 12:02:19 发布

阅读量4.7k

点赞数 2

文章标签：深度学习 attention 注意力 seq2seq 机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wangyangzhizhou/article/details/78210679

版权

自然语言处理同时被 3 个专栏收录

37 篇文章 46 订阅 ¥79.90 ¥99.00

订阅专栏

超级会员免费看

33 篇文章 53 订阅 ¥79.90 ¥99.00

订阅专栏

超级会员免费看

340 篇文章 0 订阅

订阅专栏

本文探讨了深度学习中seq2seq模型的局限性，尤其是信息压缩和丢失问题，并介绍了Attention模型作为解决方案。Attention机制模拟人类视觉注意机制，通过动态权重分配改善序列处理，解决了长序列信息稀释的问题。然而，这也会增加计算成本。文章还提到了Attention模型与seq2seq的结合方式，以及在模型中的应用。

摘要由CSDN通过智能技术生成

前言

前面看到谷歌发表的运用在机器翻译上的论文《Attention is all you need》，很是让人惊讶，这是一种全新的模型，与之前的经典的seq2seq模型改动较大，它完全摒弃了RNN或CNN神经网络，大大简化了模型的复杂度，而且效果还相当好。当然Attention模型可以单独使用，但这篇文章我们来看看Attention的机制及怎么与经典的seq2seq结合。

seq2seq

前面我们有详细的文章介绍了seq2seq的机制以及如何用TensorFlow来实现seq2seq。可到《深度学习的seq2seq模型》、《TensorFlow实现seq2seq》阅读。

seq2seq模型结构基本都大同小异，下面用一种常见结构进行说明，我们可以看到decoder将不同时刻的输入最后用一个状态C来表示,encoder部分的不同时刻的输出则为

了解本专栏

超级会员免费看

超人汪小建(seaboat)

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

超人汪小建(seaboat)

CSDN认证博客专家 CSDN认证企业博客

码龄14年

670: 原创

1万+: 周排名

912: 总排名

262万+: 访问

: 等级

2万+: 积分

4583: 粉丝

1355: 获赞

710: 评论

1306: 收藏

私信

关注

热门文章

最新评论

我的新书《Java编程动手学》
Kwan的解忧杂货铺@新空间代码工作室: 博主的文章总是带着深思熟虑，给予我新的学识，每篇博客都是一次心灵的洗礼，你的分享不仅教育了我，也丰富了我的内心世界。期待你的未来更新，继续前行！
Tomcat内核、集群、参数及性能
超人汪小建(seaboat): 哈哈，好多年前的代码了
Tomcat内核、集群、参数及性能
Lv_Jin_Gang: * @author seaboat * @date 2016/4/11 * @version 0.1 * * <pre> * <b>copyright: </b>ctg * </pre> * * <pre> * <b>email: </b>849586227@qq.com * </pre> * * <pre> * <b>blog: </b>http://blog.csdn.net/wangyangzhizhou * </pre> * * <pre> * Please go to the url below to get all statements. * </pre> * @see http://xxxxxxudal/ctg-udal-sqlparser
Tomcat内核、集群、参数及性能
Lv_Jin_Gang: 我看你写的udal的源码了，只可惜在电信那会没多看你们的源码
从JDK源码看String(上)
梦凝哲雪: JDK8 还是 char数组 9已经变成 byte了

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

超人汪小建(seaboat) 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。