Transformer 工作流程（大白话版）

chen008hi

于 2024-08-02 21:27:05 发布

阅读量678

点赞数 14

文章标签： transformer 深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41312236/article/details/140880596

版权

Transformer 工作流程：通俗易懂的解释

想象一下，你在参加一个创意写作班，你和其他几位同学一起写一篇故事。老师会让每个人轮流写一段，但在写之前，你们可以参考之前同学写的内容。这有点像 Transformer 的工作流程。让我们一步步来解释。

编码器（Encoder）

1. 输入嵌入层（Input Embedding）

首先，你们每个人写的段落会被转换成一系列数字，就像把每个词变成一组独特的代码。这些代码让计算机能够理解文本内容。

2. 位置编码（Positional Encoding）

虽然每个词变成了代码，但我们还需要知道这些词在句子中的位置。所以，我们给每个词加上一些位置信息，告诉计算机哪个词在前，哪个词在后。

3. 多头自注意力机制（Multi-Head Self-Attention Mechanism）

接下来，我们要确定每个词的重要性。比如，你写了一句：“猫在沙发上睡觉。” 计算机会检查“猫”和“睡觉”的关系，看看它们之间有多重要。自注意力机制会给每对词打分，分数越高，表示它们关系越密切。多个头（Heads）同时做这件事，以便从不同角度看待词与词之间的关系。

4. 前馈神经网络（Feed-Forward Neural Network）

然后，这些信息会经过一个神经网络，就像经过一个“思考器”，它会进一步处理这些关系，提取出更有用的特征。

5. 残差连接和层规范化（Residual Connection and Layer Normalization）

为了让计算过程更加稳定，我们会加入一些捷径，让信息可以绕过某些处理步骤（残差连接），并对结果进行标准化（层规范化），确保每一步的输出都在一个合理的范围内。

编码器的每一层都会重复上述步骤，逐步提炼出更高级的特征。

解码器（Decoder）

1. 输入嵌入层和位置编码

解码器的开始部分与编码器类似，把要生成的目标句子（比如，翻译成另一种语言的句子）也转换成代码，并加上位置信息。

2. 掩码多头自注意力机制（Masked Multi-Head Self-Attention Mechanism）

在生成过程中，我们不想让当前生成的词看到未来要生成的词。所以我们使用掩码技术，确保当前词只能看到已经生成的词。就像你写作时，只能参考之前同学写的部分，不能提前看到他们接下来会写什么。

3. 多头注意力机制（Multi-Head Attention Mechanism）

解码器还会参考编码器生成的内容。就像你可以看看之前同学写的段落（编码器输出），结合自己已经写的部分（解码器输入），继续写下去。

4. 前馈神经网络、残差连接和层规范化

接下来的步骤与编码器类似，进一步处理信息，让生成的内容更加自然、流畅。

解码器的每一层也会重复这些步骤，逐步生成完整的句子。

输出层

线性变换和 Softmax
最后，解码器的输出会通过一个线性层，然后通过 Softmax 层，把结果转换成词的概率分布，最终生成一个词。就像你每次写一句话时，从一大堆可能的词中选择最合适的那个。

总结

输入序列 通过编码器处理，生成上下文表示。
解码器 使用这些上下文表示和已生成的部分句子，逐步生成完整句子。
Transformer 通过自注意力机制，高效地理解和生成自然语言，确保每个词都能与上下文紧密联系，并且能够并行处理，提高效率。

通过这些步骤，Transformer 模型能够高效、准确地理解和生成自然语言，使得机器翻译、文本生成等任务更加出色。

关注

14
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
Transformer 工作流程（大白话版）

输入序列通过编码器处理，生成上下文表示。解码器使用这些上下文表示和已生成的部分句子，逐步生成完整句子。通过自注意力机制，高效地理解和生成自然语言，确保每个词都能与上下文紧密联系，并且能够并行处理，提高效率。通过这些步骤，Transformer 模型能够高效、准确地理解和生成自然语言，使得机器翻译、文本生成等任务更加出色。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。