attention
happyprince
这个作者很懒,什么都没留下…
展开
-
深度学习中的注意力机制
作者 | 张俊林 出处 | https://blog.csdn.net/malefactor/article/details/78767781 最近两年,注意力模型(Attention Model)被广泛使用在自然语言处理、图像识别及语音识别等各种不同类型的深度学习任务中,是深度学习技术中最值得关注与深入了解的核心技术之一。 本文以机器翻译为例,深入浅出地介绍了深度学习中注意力机制的...转载 2018-11-21 11:55:33 · 282 阅读 · 0 评论 -
详解Attention is All U Need
原文链接 https://blog.csdn.net/lqfarmer/article/details/73521811 已有Seq2Seq模型 Seq2Seq模型是处理序列到序列问题的利器,尤其是在神经网络翻译方面,取得了很大的成功。Seq2Seq常常由一个encoder和一个decoder构成,encoder把观测样本X编码成一个固定长度的隐变量Z...转载 2018-12-19 16:27:27 · 389 阅读 · 0 评论