Transform学习

最新推荐文章于 2023-11-07 17:42:59 发布

。七十二。

最新推荐文章于 2023-11-07 17:42:59 发布

阅读量452

点赞数

分类专栏：神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/laner__gg/article/details/119748092

版权

神经网络专栏收录该内容

36 篇文章 1 订阅

订阅专栏

参考：https://blog.csdn.net/u013069552/article/details/108074349?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522162916179216780357226446%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=162916179216780357226446&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~top_positive~default-1-108074349.ecpm_v1_rank_v29&utm_term=Transform&spm=1018.2226.3001.4187

1、transform整个网络的结构主要是由attention组成（仅由self-attention和Feed Foward neural network组成）。

2、encoder部分分为：self-attention和feed-forward组成，数据经过self-attention之后得到一个加权的特征向量，被送入一个具有两层网络结构的feed-forward.

decoder部分多了一个encoder-decoder attention,两个attention分别用于计算输入和输出的权值。decoder中self-attention模块关注翻译与之前翻译的关系；encoder-decoder-attention关注翻译和当前编码的特征向量之间的关系。

。七十二。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Transform学习

参考：https://blog.csdn.net/u013069552/article/details/108074349?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522162916179216780357226446%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=162916179216780357226446&biz_id
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

。七十二。 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。