Transformer模型

gbe008

于 2023-08-10 22:00:16 发布

阅读量88

点赞数

文章标签： transformer 深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gbe008/article/details/132219392

版权

目的：
理解Transformer模型，借鉴设计思路

参考的是Transformer做翻译的模型

一、人工翻译原理(个人理解)
1、熟悉源、目标词汇
2、熟悉源、目标语法
3、理解源上下文

二、Transformer模型核心(个人理解)
通过巧妙设计，将
1、源及目标词汇表
2、源句子词汇位置关系，彼此关联度评分
3、目标句子词汇位置关系，彼此关联度评分
三者关联在一起，达到源句子与目标句子勾连(这过程很复杂)，然后生成预测句子。
预测句子再与标签句子概率比较，判定预测结果准确性。
过程产生巨量参数矩阵记录这种细节特征。
通过多次迭代修订参数矩阵，使得预测句子不断的逼近标签句子。完成训练。

贴图仅是为了好看:

三、收获：
1、任何一种应用场景的模型，都是其内在规律的表达，
模型设计是分析规律之后使用某种工具把内在规律表达出来。
2、torch的nn.module基类提供了一种普遍可行的工具框架。(TensorFlow也类似)

四、问题
1、模型结构复杂细节多，且理论高度集成，理解耗时
2、训练及调整时间成本过高，1000万英文句子+1000万中文句子训练
在3080ti 16G显存需要6个小时完成一批次，如果想获得好的效果，需要训练100次以上...

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

gbe008 CSDN认证博客专家 CSDN认证企业博客

码龄5年

4: 原创

163万+: 周排名

150万+: 总排名

1638: 访问

: 等级

40: 积分

2: 粉丝

0: 获赞

3: 评论

9: 收藏

私信

关注

热门文章

最新评论

CNN卷积神经网络模型-01.困惑
CSDN-Ada助手: 恭喜你开始了博客创作！标题“CNN卷积神经网络模型-01.困惑”透露出你在学习过程中遇到的困惑，这是非常正常的。你已经迈出了第一步，这是一个了不起的成就！接下来，我建议你可以继续探索并分享一些解决这个困惑的方法，或者分享一些你在学习中遇到的其他问题和解决方案。这样可以帮助其他读者更好地理解和应用卷积神经网络模型。期待你的下一篇博客！加油！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
Transformer模型
CSDN-Ada助手: 恭喜您写了第四篇博客！标题“Transformer模型”非常吸引人，我很期待阅读您关于这个话题的深入探讨。您的持续创作展示了您对技术的执着和热情，真是令人钦佩。在下一步的创作中，或许可以探索Transformer模型在自然语言处理或者图像识别领域的应用案例，这将为读者提供更多有价值的知识。再次感谢您的分享，期待更多精彩的博客！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
CNN卷积神经网络模型-02.调参(过拟合）
CSDN-Ada助手: 非常棒的博文！你对CNN卷积神经网络模型的调参问题讲解得非常详细，让读者可以更好地理解和应用这一技术。我鼓励你继续创作，分享更多有用的知识。除了你在标题和摘要中提到的内容，还有一些与该博文相关的扩展知识和技能可以进一步了解。比如，你可以学习关于优化算法的知识，如随机梯度下降和动量法，这对于解决过拟合问题非常重要。此外，对于图像处理方面，你可以研究一下数据增强的方法，比如随机裁剪、翻转和缩放，以提高模型的泛化能力。再次感谢你的分享，期待你的下一篇博文！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。