AIGC实战——Transformer模型

最新推荐文章于 2024-07-25 02:21:01 发布

盼小辉丶

最新推荐文章于 2024-07-25 02:21:01 发布

阅读量3.2k

点赞数 90

分类专栏： AIGC生成式人工智能从入门到实战文章标签： AIGC transformer 深度学习

本文链接：https://blog.csdn.net/LOVEmy134611/article/details/137000581

版权

AIGC生成式人工智能从入门到实战专栏收录该内容

24 篇文章 41 订阅 ¥39.90 ¥99.00

订阅专栏

AIGC实战——Transformer模型

0. 前言

我们在 GPT (Generative Pre-trained Transformer) 一节所构建的 GPT 模型是一个解码器 Transformer，它逐字符地生成文本字符串，并使用因果掩码只关注输入字符串中的前一个单词。另一些编码器 Transformer，不使用因果掩码，而是关注整个输入字符串以提取有意义的上下文表示。对于一些其他任务，如语言翻译，可以使用编码器-解码器 Transformer，将一个文本字符串翻译为另一个文本字符串，这类模型包含编码器 Transformer 块和解码器 Transformer 块。下表总结了三种类型的 Transformer 模型，其中列出了每种架构的典型模型和用途。

类型	典型模型	应用
Encoder	BERT	文本分类，命名实体识别，抽取式问答
Encoder-Decoder	T5	翻译，问答
Decoder	GPT-3	文本生成

编码器 Transformer 的一个经典模型是 Google 开发的双向编码器自注意力转换 (Bidirectional Encoder Represent

了解本专栏

盼小辉丶

关注

90
点赞
踩
85

收藏

觉得还不错? 一键收藏
打赏
108
评论
AIGC实战——Transformer模型

GPT 模型是一个解码器 Transformer，它逐字符地生成文本字符串，并使用因果掩码只关注输入字符串中的前一个单词。另一些编码器 Transformer，不使用因果掩码，而是关注整个输入字符串以提取有意义的上下文表示。对于一些其他任务，如语言翻译，可以使用编码器-解码器 Transformer，将一个文本字符串翻译为另一个文本字符串，这类模型包含编码器 Transformer 块和解码器 Transformer 块。
复制链接

扫一扫