Transformers -- 以通俗易懂的方式解释 - Part 1

本文以非技术性的方式介绍了Transformer神经网络的工作原理,涉及代币化、词嵌入和位置嵌入等步骤,以及自注意力机制在理解和生成回应中的作用。通过这个过程,解释了大型语言模型如ChatGPT如何理解输入并生成连贯的回答。
摘要由CSDN通过智能技术生成

公众号:Halo咯咯,欢迎关注~

本系列主要介绍了为ChatGPT以及许多其他大型语言模型(LLM)提供支持的Transformer神经网络。我们将从基础的Transformer概念开始介绍,尽量避免使用数学和技术细节,使得更多人能够理解这一强大的技术。

Transformers -- 以通俗易懂的方式解释 - Part 1


在ChatGPT或其他类似的大型语言模型(LLM)中,当您提出问题后,模型会生成一系列单词作为回答,这个过程可能看起来就像您的朋友通过消息应用程序逐字回复您的消息一样。不过,这里的一个区别是,模型在生成每个单词时都进行了精心的计算和选择,而不是简单地按发送键。

第一阶段:理解您的输入

阶段 1.1:准备——代币化

在人工智能和机器学习领域,处理的是数字数据。所以,首先要把您的问题分解成单词,并把每个单词转换成数字。可以想象成一个庞大的词典,里面每个单词都对应一个数字编号。比如,您问:“如何撰写博客文章?” 这个问题会被分解、转换成一系列数字,以便模型能够理解和处理。

  • 20
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Halo 咯咯

有你的支持我会更加努力。

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值