大语言模型（LLM）工作的3个步骤，一文带你搞清楚！

木易AI信息差

于 2024-07-16 07:14:57 发布

阅读量618

点赞数 28

文章标签：人工智能机器学习 AI

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40774379/article/details/140454845

版权

生成式AI中常说的token是什么？嵌入（Embeddings）是什么意思？为什么现在的AI具有生成能力？AI是怎么和你进行对话的？为什么都说提示词很重要？为什么同一段提示词，同一个AI模型/工具，多问几次可能得到截然不同的结果？

要回答以上这些问题，你需要了解大语言模型（LLM）是如何工作的。知其然，也要知其所以然。

步骤1：分词（Tokenize）

面对一个问题，我们人类的习惯性操作是什么？理解问题。LLM也是一样。

LLM在处理输入文本时，首先使用分词器（Tokenizer）将文本分割成若干小的文本块，即tokens。这些tokens由可变数量的字符组成，随后被转换成高维向量的数值表示，也就是嵌入（embeddings），供模型处理。这一步骤是模型理解语言的基础，类似于人类阅读和解析文本的过程。

分词（Tokenize）是LLM工作的第一步&#x

最低0.47元/天解锁文章

木易AI信息差

关注

28
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
大语言模型（LLM）工作的3个步骤，一文带你搞清楚！

大语言模型（LLM）工作的3个步骤，一文带你搞清楚！
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。