机器学习_初识attention

最新推荐文章于 2024-08-18 12:02:19 发布

小豆芽_

最新推荐文章于 2024-08-18 12:02:19 发布

阅读量695

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_38034312/article/details/78706648

版权

【1】NLP中有一类问题：给定一段上下文（context），生成一段与context相关的（target）

eg：翻译/阅读理解/摘要生成

【2】这类问题需要RNN解码，用一个 RNN encoder读入context，得到一个context vector（RNN的最后一个hidden state）；然后另一个RNN decoder以这个hidden state为起始state，依次生成target的每一个单词。

【3】这种做法的缺点是，无论之前的context有多长，包含多少信息量，最终都要被压缩成一个几百维的vector。这意味着context越大，最终的state vector会丢失越多的信息。输入sentence长度增加后，最终decoder翻译的结果会显著变差。

【4】因为context在输入时已知，一个模型完全可以在decode的过程中利用context的全部信息，而不仅仅是最后一个state。这就是attention思想

【5】https://www.zhihu.com/question/36591394

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

小豆芽_ CSDN认证博客专家 CSDN认证企业博客

码龄8年

90: 原创

76万+: 周排名

221万+: 总排名

20万+: 访问

: 等级

2816: 积分

9: 粉丝

28: 获赞

6: 评论

95: 收藏

私信

关注

热门文章

分类专栏

ppt 1篇
matlab 1篇
逗比日记 4篇
量化投资
机器学习 24篇
python 16篇
数据挖掘
日记
并行计算 1篇
ubuntu 3篇
C++ 2篇
算法 1篇
NLP 6篇
linxu 6篇
业务
Git 1篇
Hadoop
Hive 1篇
剑指offer 1篇
数学 1篇

最新评论

机器学习_直线/平面的函数形式
伊赛芙: 平面的点法式应该是：A(x-x0)+B(y-y0)+C(z-z0)=0。
Python_删除指定字符串
赫连达回复 Tesla_License: string.replace并非原地操作，而是会返回操作的结果，你如果使用[code=python] new_string=string.replace('abc','') [/code] 就可以看到想要的结果了
Python_删除指定字符串
Tesla_License: 其实上这样做的话是没有删除的，它依旧存在；[code=python] string = input（）#这里输入abc print(string.replace("abc",""))#表面上看是删除了 print(string)#打印出来还是abc [/code]
机器学习_概率密度函数和似然函数
qq_281617953: 最大似然函数跟概率密度函数，当进行一次事件时，系统的最大似然函数就是概率密度函数
机器学习_miml多示例多标记算法
纵横阡陌: 朋友你好，请问你多示例研究的如何呢，请教交流下好吗

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。