AI大模型的运作和剁椒鱼头的关系-CSDN博客

本文链接：https://blog.csdn.net/python12222_/article/details/139114097

在这里插入图片描述

今天我们尝试来理解AI大模型的工作原理。虽然这种课程听上去并不是直接教给了你一个随时就可以上手使用的技能，但远比技巧性的课程更加重要。因为只有你真的理解了它的运转逻辑，你才知道如何更好地进一步优化你的操作，得到更好的答案，产出更有价值的内容。这就像我们学开车，一定要先学理论。拧开钥匙踩油门就走谁不会啊？小朋友都会，但是如果你不懂得交通规则的基础原理，出了门，何时踩刹车，何时亮转向灯都成问题，那么这种车开起来我想也不是那么安全。

首先，我们来看一下AI大模型的运转逻辑是怎样的。我们拿目前最火的最好用的ChatGPT来进行解读，ChatGPT是一个基于生成式预训练模型架构。它的运作原理主要可以分为：预训练、微调、输入处理、模型推理、输出生成、后处理六个步骤。

第一个阶段是预训练。

什么是预训练呢？这就相当于一个无所不能的餐饮大师，在还没有成长为大师前，遍访天下名师，学习各个地方的菜系，还深度地学习和研究，为什么湖南人比较喜欢吃辣，江浙一带喜欢甜口，为什么湖南人吃的是香辣，四川人吃的是麻辣。他用了大量的时间掌握了各地的饮食文化和菜系，并根据历史演变、人文发展整理成了一个系统的内容，为自己下一步成为餐饮大师打下了基础，这就是预训练。ChatGPT的预训练也是一样，在预训练阶段，模型会通过大量的文本数据进行训练，不仅学习各大领域、各大行业、各大民族等方面的内容，还学习各大语言的基本结构、语法和上下文关系，这一个阶段的主要目标是让模型能够理解并生成自然语言文本。这也是为什么ChatGPT明明是一个纯英文产品，中国人用汉语跟他对话，却也得心应手。

在这里插入图片描述

第二个阶段叫做微调。

这个阶段像什么呢？就像刚才举例的那个餐饮大师，他要对自己掌握的全天下的餐饮数据进行细节的调整和梳理。比如说，两个地区的人都吃面食，但他们的发酵手法却不一样，比如说湖南人喜欢吃辣椒，但细分到每个地级市，县城，甚至是乡村，大家吃的辣椒品种、辣度以及辣椒的做法还不一样。比如我们湘阴老家盛产一种叫做樟树港的辣椒，很香，但一点辣味都没有，而且我们炒这个品种的辣椒，连辣椒的蒂都会保留一起下锅。ChatGPT的微调也是一样，在微调阶段，大模型会根据特定的细分的任务和数据进行进一步的调整和优化。比如，当ChatGPT针对各个国家各个领域的细分人群进行对话和问答任务的微调，那么它在接下来的使用过程中，每个不同国家和民族、职业的人使用ChatGPT时就会得到更加适合他们各自的回答。当一个餐饮大师掌握了大量的饮食文化的数据后，它可以为不同地域、不同年龄、不同性别、不同喜好的人提供最适合他们的餐饮服务。

第三个阶段叫做：输入处理。

当用户输入一段文本时，大模型会首先把我们的文本转化成为模型可以理解的形式，只是我们作为用户并不会察觉。这就包括把文本分割成单词或者词片段，也叫做token，然后将这些token转化成为对应可以量化的表示。这就相当于餐饮大师已经根据全国各大地域、民族、年龄、性别等特征的人群进行细分后提供的一个可以满足任何人的菜单。前来点餐的人只需要根据提示选定好和自己需求相匹配的纬度，并进行个性化需求的标注。

第四个阶段叫做模型推理。

既然餐饮大师的大模型已经整理了全世界所有种族、民族、国家和地域等细分特征的人群的饮食文化，也制作出来了可以让顾客根据自己特征和需求下单的系统。那么当顾客把自己的需求根据要求输入大模型的时候，大模型就会开始进行模型的推理。这个模型的推理简单来理解，就是将顾客提供的需求数据和大模型训练的数据进行精准的梳理和匹配。比如说一个来自湖南长沙的男性，想要点一个有辣味的新鲜的鱼头，那么大模型大概率会为他匹配剁椒鱼头的做法，而不是其他片片鱼或者石锅鱼。

第五个阶段叫做输出生成。

很容易理解，顾客既然已经下单了，餐饮大师也理解了对方的需求，知道对方要吃啥菜系，要几分辣，要不要香菜。那么接下来要干什么呢？下厨，炒菜呗。这就是输出生成。GPT的模型的最终输出，是一个概率分布，用于表示每个可能的下一个词的概率。大模型会根据这些概率选择最有可能的词，并声称连续的词语，直到形成完整的回答或达到预设的响应程度。这也是为什么可以用GPT来写长篇小说的关键。

第六个阶段叫做后处理。

用在我们的比喻里，叫什么呢？就是菜炒好了，出锅，摆盘。把这个顾客要的剁椒鱼头更好的从锅里转移到菜碗菜碟里，用抹布擦掉周边多余的油渍，撒上一些葱花和芝麻，然后还在旁边给你点缀上一些小星星小花朵，然后让出品的工作人员给顾客端上桌，让顾客享用。实际上，GPT在你发出指令的过程中，它并非捕捉到了你的需求后就直接回应你，而是会在后处理这个阶段，将模型生成的词序列转化为连贯的自然语言文本，最终返回给用户。

如何学习AI大模型？

现在社会上大模型越来越普及了，已经有很多人都想往这里面扎，但是却找不到适合的方法去学习。

作为一名资深码农，初入大模型时也吃了很多亏，踩了无数坑。现在我想把我的经验和知识分享给你们，帮助你们学习AI大模型，能够解决你们学习中的困难。

我已将重要的AI大模型资料包括市面上AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习，等录播视频免费分享出来，需要的小伙伴可以扫取。

在这里插入图片描述

一、AGI大模型系统学习路线

很多人学习大模型的时候没有方向，东学一点西学一点，像只无头苍蝇乱撞，我下面分享的这个学习路线希望能够帮助到你们学习AI大模型。

在这里插入图片描述

二、AI大模型视频教程

在这里插入图片描述

三、AI大模型各大学习书籍

在这里插入图片描述

四、AI大模型各大场景实战案例

在这里插入图片描述

五、结束语

学习AI大模型是当前科技发展的趋势，它不仅能够为我们提供更多的机会和挑战，还能够让我们更好地理解和应用人工智能技术。通过学习AI大模型，我们可以深入了解深度学习、神经网络等核心概念，并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时，掌握AI大模型还能够为我们的职业发展增添竞争力，成为未来技术领域的领导者。

再者，学习AI大模型也能为我们自己创造更多的价值，提供更多的岗位以及副业创收，让自己的生活更上一层楼。

因此，学习AI大模型是一项有前景且值得投入的时间和精力的重要选择。