AI深度探秘：4个常用参数，让你轻松驾驭聊天大模型！（上篇）

雪碧没气阿

于 2024-08-26 10:21:03 发布

阅读量227

点赞数 1

文章标签：人工智能大语言模型自然语言处理 ai大模型 LLM 深度学习计算机技术

本文链接：https://blog.csdn.net/xxue345678/article/details/141557399

版权

相较于2023年初面对ChatGPT的茫然和兴奋，2024年，各个平台的聊天大模型产品此起彼伏，才不到半年的时间，整个大模型市场却比去年一年还要激烈。

换个通俗点的说法，就是这一年多来，各家聊天大模型厂商各种“卷”，卷模型尺寸，卷模型价格，卷模型类型，卷模型目标用户……

然后卷着卷着，原本用户看着用不起的AI聊天大模型，突然发现不仅选择变多了，整体价格也便宜了，嘿，貌似用得起了！

事实上，这一年多来，正在有越来越多的用户在尝试接触AI，了解AI，并学着使用AI。甚至于这个阶段出现的很多AI相关的产品，有些只是带上AI的包装，或者只是非常浅显的AI应用，都可以卖得很好！

每每看到这些，我就觉得莫名心痛，外加万分羡慕！

心痛的是我接触AI有一段日子了，但是我却依然学不会挣那份钱，羡慕的是他们怎么就能变现得这么好的？

聊天大模型，是各类AI产品中最易上手的一类产品。在各个平台推出的各种聊天大模型中，有4个参数是基本都有的，使用效果也是最直观的。

理解透彻这4个参数，实际应用中才能更好地使用它们，轻松驾驭聊天大模型自然也就不在话下了。

Messages

第一个参数，自然是“Messages”！

它是每一个聊天大模型里都不可能缺失的核心参数。

如果用我们国人直译的概念来看，“消息”，这个其实不太好理解，这是由语言环境决定的，没有办法。

事实上，这个词说的是指用户和大语言模型的所有聊天对话列表。

其实说是“聊天对话列表”也不太确切了，Messages是发给大模型的所有消息的综合，包括用户之前和模型的对话、示例、System设定。

而在聊天大模型出现多模态的融合后，有些大模型的Messages还包括了文件、图片等等多模态信息需要的资源文件类型的内容。

对于聊天大模型而言，东西再多，也就是打包一个Messages的事情，哪怕这个Messages中的“s”,是“sssssssssssss……”

接下来，就细说下Messages里的各种组成：

先说对话。

在大多数聊天大模型中，Messages里通常会存在三个角色（role）：System、User和Assistant。不过，System这个角色，可能会在某些小模型中缺失。

正常情况下，用户每一次和聊天大模型聊天，对话中包括了前面若干轮的用户（User）和大模型(Assistant)你一句我一句的对话组合。

然而，我都说了嘛，正常情况是这样，那，自然会有不正常的情况了。

比如，给之前聊的每一句加一点内容或者减一点？

谁也没有规定说这些对话内容必须是原汁原味的，既然是要发给聊天大模型的，那在没发之前，作为用户和操作者，只要有能力，当然是可以随便截个胡篡改一下的。

再过分点，加塞也是可以的嘛！

正常情况下，对话是由用户一句大模型一句组成的。

如果在对话中间再加一句用户的或者大模型的对话，形成格式类似”{“用户”}{“用户（或大模型）”}{”大模型“}“的对话内容……

也不知道大模型要是真有”心“的话，会不会感觉到心塞？

反正这样做数据的我也不是没见过，塞什么的都有，只要格式保持规范，且模型可以容忍这样的格式存在，大多数大模型还是可以认出来的。

说点你可能不知道的：

有些大模型对于对话的格式要求就比较高，要求对话必须是”{用户}{大模型}“的对话组格式，那就不能这么乱组合，否则发都发不出去，比如文心一言的一些模型，或者某些开源模型。

所以如果想搞些奇怪的调用方式的时候，一定要仔细查看该模型API中关于Messages内容格式的要求。

还有不正常的做法：Messages的对话内容中，能发成一个小长篇的见过没有？前文留出个几百个对话的见过没有？

但凡模型小一点的，都吃不下这一坨……

至于效果，实在不好说。

继续说些你可能不知道的：

Messages里的内容对于模型的回复是有影响的，这个很多人都知道，通常聊天大模型都会有提供相关的参数进行控制。

但是，即使有参数调控，现有的大模型中，Messages中关联前文的问答对通常在5轮以内效果会比较好，有一些模型实测效果可能只能支持3轮，并且与每一轮的对话长度也有一定关系**。过多轮次的问答对对话存在的时候，大模型可能并不能从这里面找到合适的内容联系，越早存在的问答对，其可能被关联回复的机率反而可能是越小的。**

当然，随着模型基础能力的提升，这一点并不绝对。

再说说Messages中的示例：

如果有查看过一些模型的API，就会发现，很多聊天大模型中用户使用的“示例”部分，其实也是Messages中对话的一部分。

毕竟示例本身一问一答的模式，就是个模拟用户和大模型对话的问答对组合。

通常来说，使用示例的目的是为了约束大模型回复的效果。换句话说，就是给大模型的回复打个样。

但是，如果模型本身推理能力不够强的话，可能再怎么打样也是白瞎。

这种情况，小模型里比较多见，开源模型参数比较大的，或者大多数的闭源模型，情况一般都不会太糟。

同样，说点你可能不知道的：

有时候我们希望模型达成指定的一些回复，比如希望用户说"1"的时候，模型回复"0"，但在实际应用中，模型很可能对一些特定的例子作出一些奇怪的回复，这个时候，把这些特殊的例子做成示例，就能很好地避免这种奇怪的问题出现，因为模型在遇上相同的问题的时候，优先会参考示例进行回答。

再说一说Messages中的System设定：

大多数模型中都会有这个System，主要是用来进行背景提示、系统设定、角色规则设定、回复要求制定等等。

如果有留意过市场上的一些聊天大模型的应用，有很多应用都是利用这个System的Prompt来达成的，效果也是立竿见影。

这个参数在Messages里的地位也比较特殊，比起上面的对话和示例而言，它对大模型的回复影响要重要得多。通常情况下，它在每次发往聊天大模型的Messages里只会同时存在一个。

同样的，自然也存在一些不通常的情况，比如，有些模型就没法进行System设定，再比如，既然没有硬性规定只许一个System的存在，那在使用某些模型的时候，可以一次制作2个或更多个System，居然大模型也不会有异常……

不得不说，某些公认的比较强力的聊天大模型，在某些时候，还是值得我们依赖的。

也说一些你可能不知道的东西吧：

大语言模型毕竟是程序语言的产物，尽管按照自然语言做过很多处理，但在很多大模型中，这种痕迹是刻在骨子里的。System在聊天大模型中其重要性和特殊性又如此明显，所以，在市面上流行的一些模型中，将System处理成按照程序语言的一些要求或者格式输入的内容，尽管意思相同，但可能System的效果更好哦！

多模态的出现丰富了Messages携带的内容，目前一些附带有多模态能力的聊天大模型中，文件、图片等内容都提供了特殊的参数，并作为Messages中某个Role的一部分内容存在，比如国内的Kimi模型，或者Openai新出且火遍全球的4O模型。

不过现阶段，Role目前仅仅只包括用户（User）和大模型（Assistant），System暂时还没见过可以这么玩的。

也说点你可能不知道的东西吧：

多模态这个能力，目前在不同的平台不同的模型上会有不同的处理，但由于牵涉到额外的资源文件，所以在使用的时候有可能会导致额外的token费用（比如4o），或者资源文件的上传数量限制（比如Kimi）。有时候甚至还需要额外的方案来支持，比如某些模型会提供专门的资源文件上传方案。

说了这么多，“Messages”这个参数，现在你觉得怎么样？

其他3个参数，且听我下回分解！

如何学习AI大模型？

作为一名热心肠的互联网老兵，我决定把宝贵的AI知识分享给大家。至于能学习到多少就看你的学习毅力和能力了。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

一、全套AGI大模型学习路线

AI大模型时代的学习之旅：从基础到前沿，掌握人工智能的核心技能！

二、640套AI大模型报告合集

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。

四、AI大模型商业化落地方案

作为普通人，入局大模型时代需要持续学习和实践，不断提高自己的技能和认知水平，同时也需要有责任感和伦理意识，为人工智能的健康发展贡献力量。

雪碧没气阿

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
AI深度探秘：4个常用参数，让你轻松驾驭聊天大模型！（上篇）

相较于2023年初面对ChatGPT的茫然和兴奋，2024年，各个平台的聊天大模型产品此起彼伏，才不到半年的时间，整个大模型市场却比去年一年还要激烈。换个通俗点的说法，就是这一年多来，各家聊天大模型厂商各种“卷”，卷模型尺寸，卷模型价格，卷模型类型，卷模型目标用户……然后卷着卷着，原本用户看着用不起的AI聊天大模型，突然发现不仅选择变多了，整体价格也便宜了，嘿，貌似用得起了！事实上，这一年多来，正在有越来越多的用户在尝试接触AI，了解AI，并学着使用AI。
复制链接

扫一扫