一文读懂「Transformer」算法模型

朱晓霞AI

已于 2025-02-11 12:23:02 修改

阅读量2.4k

点赞数 32

分类专栏： AI人工智能：一文读懂「X」系列文章标签： transformer 深度学习人工智能

于 2024-01-08 14:58:23 首次发布

本文为博主原创文章，未经博主允许不得转载。

本文链接：https://blog.csdn.net/Julialove102123/article/details/135457093

版权

AI人工智能：一文读懂「X」系列专栏收录该内容

65 篇文章 ¥49.90 ¥99.00

订阅专栏

超级会员免费看

前面讲到过chatgpt的知识，提到了chatgpt的实现原理包含了transformer内容，所有非常有必要来补充一下这部分的内容。
资料：一文读懂「Attention」注意力机制

在这里插入图片描述

一、什么是Transformer？

Transformer 是 Google 的团队在 2017 年提出的一种 NLP 经典模型，现在比较火热的 Bert 也是基于 Transformer。Transformer 模型使用了 Self-Attention 机制，不采用 RNN 的顺序结构，使得模型可以并行化训练，而且能够拥有全局信息。

🔍 Why Transformer？

RNN：能够捕获长距离依赖信息，但是无法并行计算；
CNN：能够并行，无法捕获长

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

朱晓霞AI 您的鼓励是我最大的动力！

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。