Transformer 中-英运行和简单理解（二）

啥也不是的py人

于 2023-04-04 18:20:54 发布

阅读量502

点赞数 1

分类专栏： # Transformer 文章标签： transformer 深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_50920579/article/details/129810189

版权

Transformer 专栏收录该内容

2 篇文章

订阅专栏

文章介绍了Transformer模型在机器翻译中的应用，重点讲解了seq2seq模型的基础，RNN的位置信息处理，以及Transformer如何通过self-attention和多头注意力机制来捕获词与词之间的关系。每个encoder独立处理输入单词，经过embedding和多头self-attention后输出对应翻译。读者可以通过提供的项目地址进行实践。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

目录

回顾

seq2seq：

要输入额外的tokens

<start>和<end>

然后循环做点积

然后依次对每个tokens做attention

最后完成翻译

RNN

RNN是依次输入每个tokens自带位置信息

transforemer是通过poisition encoding来捕获位置信息

self-attention

可以看到下面句子中的 it 的意思并不相同

要用self-attention来获得

蓝色代表softmax的结果越深代表着权重更大

第一个animal的权重更大

第二个street的权重更大

架构

每个encoder都是相对独立并不共享权重

每个输入单词被映射到512维的向量上

句子中的每个单词都独立地进入self-attention

多头注意力就是用多组QKV来分组捕捉特征

比如说多头的超参是8

就是把512维度的embeding分成8*64个来做attention

这样可以捕捉到每个单词对应整句话中跟其他八个单词的关系

整个过程就是：

1.输入的句子拆成单词，比如输入 i love u分成 i love u三个单词

2.三个单词依次embeding x1 x2 x3

3.然后对这三个embeding 做多头self-attention

4.然后就可以输出每个单词对应其他语种里改率最高的词

5. 上述输出就应该是z1中我的概率最高

6. 然后输入我到transformer中

7.第二个单词输出爱的概率最高，然后将爱作为输入输入到transformer中

8.第三个输出你的概率最高

运行

地址：

Transformer中-英: NLP项目，主要包括atten-seq2seq和transformer模型，实现机器翻译以及对话系统。目前transformer只做了机器翻译。

git clone后

修改

和device即可

具体见仓库的readme

运行后结果是

References

transform代码pytorch实现机器翻译_哔哩哔哩_bilibili

啥也不是的py人

博客等级

码龄5年

180
原创

714
点赞

3008
收藏

4万+
粉丝

关注

私信

热门文章

分类专栏

机器人 1篇
vrep 9篇
ros 31篇
pybullet 13篇
issacgym 3篇
mujoco 4篇
编程语言
python 32篇
c 5篇
机器学习 1篇
Transformer 2篇
PointCloud 8篇
pytorch 11篇
yolo 5篇
colab 1篇
环境创建 7篇
运维 15篇
docker 1篇
cv 3篇
bim 5篇
前端 9篇
硬件 2篇
力学 1篇

最新评论

pybullet GGCNN数据集制作（三）
weixin_45686926: 请问标注的图片，每个图片只能标一个嘛，还是可以一次标多个目标
pybullet GGCNN数据集制作（三）
weixin_45283798: 为什么我标注出来的很多txt是空的
AttributeError: Can‘t get attribute ‘SPPF‘ on ＜module ‘models.common‘ from ‘H:\\yolov5-5.0\\models\\
小鱼快游，四面八方都是自由: 大佬，我用的5.0版本，为什么文件夹都不一样呢，我都找不到hub\runs这几个文件夹
vrep（即https://www.coppeliarobotics.com/）的安装及使用
Miracoh: 请问大佬是只能装到c盘里面嘛
pybullet 康奈尔数据集转换（四+）训练前看
m0_63908311: 作者你好，我在按照你的教程进行数据集处理时报错cv2.error: OpenCV(4.11.0) D:\a\opencv-python\opencv-python\opencv\modules\photo\src\inpaint.cpp:710: error: (-210:Unsupported format or combination of formats) 8-bit, 16-bit unsigned or 32-bit float 1-channel and 8-bit 3-channel input/output images are supported in function 'icvInpaint'，请问是什么原因呢

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。