AI深度探秘:4个常用参数,让你轻松驾驭聊天大模型!(上篇)

相较于2023年初面对ChatGPT的茫然和兴奋,2024年,各个平台的聊天大模型产品此起彼伏,才不到半年的时间,整个大模型市场却比去年一年还要激烈。

换个通俗点的说法,就是这一年多来,各家聊天大模型厂商各种“卷”,卷模型尺寸,卷模型价格,卷模型类型,卷模型目标用户……

然后卷着卷着,原本用户看着用不起的AI聊天大模型,突然发现不仅选择变多了,整体价格也便宜了,嘿,貌似用得起了!

事实上,这一年多来,正在有越来越多的用户在尝试接触AI,了解AI,并学着使用AI。甚至于这个阶段出现的很多AI相关的产品,有些只是带上AI的包装,或者只是非常浅显的AI应用,都可以卖得很好!

每每看到这些,我就觉得莫名心痛,外加万分羡慕!

心痛的是我接触AI有一段日子了,但是我却依然学不会挣那份钱,羡慕的是他们怎么就能变现得这么好的?

聊天大模型,是各类AI产品中最易上手的一类产品。在各个平台推出的各种聊天大模型中,有4个参数是基本都有的,使用效果也是最直观的。

理解透彻这4个参数,实际应用中才能更好地使用它们,轻松驾驭聊天大模型自然也就不在话下了。

图片

1

图片

Messages

第一个参数,自然是“Messages”!

它是每一个聊天大模型里都不可能缺失的核心参数。

如果用我们国人直译的概念来看,“消息”,这个其实不太好理解,这是由语言环境决定的,没有办法。

事实上,这个词说的是指用户和大语言模型的所有聊天对话列表。

其实说是“聊天对话列表”也不太确切了,Messages是发给大模型的所有消息的综合,包括用户之前和模型的对话、示例、System设定。

而在聊天大模型出现多模态的融合后,有些大模型的Messages还包括了文件、图片等等多模态信息需要的资源文件类型的内容。

对于聊天大模型而言,东西再多,也就是打包一个Messages的事情,哪怕这个Messages中的“s”,是“sssssssssssss……”

接下来,就细说下Messages里的各种组成:

先说对话。

在大多数聊天大模型中,Messages里通常会存在三个角色(role):System、User和Assistant。不过,System这个角色,可能会在某些小模型中缺失。

图片

正常情况下,用户每一次和聊天大模型聊天,对话中包括了前面若干轮的用户(User)和大模型(Assistant)你一句我一句的对话组合。

然而,我都说了嘛,正常情况是这样,那,自然会有不正常的情况了。

比如,给之前聊的每一句加一点内容或者减一点?

谁也没有规定说这些对话内容必须是原汁原味的,既然是要发给聊天大模型的,那在没发之前,作为用户和操作者,只要有能力,当然是可以随便截个胡篡改一下的。

再过分点,加塞也是可以的嘛!

正常情况下,对话是由用户一句大模型一句组成的。

如果在对话中间再加一句用户的或者大模型的对话,形成格式类似”{“用户”}{“用户(或大模型)”}{”大模型“}“的对话内容……

也不知道大模型要是真有”心“的话,会不会感觉到心塞?

反正这样做数据的我也不是没见过,塞什么的都有,只要格式保持规范,且模型可以容忍这样的格式存在,大多数大模型还是可以认出来的。

说点你可能不知道的:

有些大模型对于对话的格式要求就比较高,要求对话必须是”{用户}{大模型}“的对话组格式,那就不能这么乱组合,否则发都发不出去,比如文心一言的一些模型,或者某些开源模型

所以如果想搞些奇怪的调用方式的时候,一定要仔细查看该模型API中关于Messages内容格式的要求。

还有不正常的做法:Messages的对话内容中,能发成一个小长篇的见过没有?前文留出个几百个对话的见过没有?

但凡模型小一点的,都吃不下这一坨……

至于效果,实在不好说。

继续说些你可能不知道的:

Messages里的内容对于模型的回复是有影响的,这个很多人都知道,通常聊天大模型都会有提供相关的参数进行控制。

但是,即使有参数调控,现有的大模型中,Messages中关联前文的问答对通常在5轮以内效果会比较好,有一些模型实测效果可能只能支持3轮,并且与每一轮的对话长度也有一定关系**。过多轮次的问答对对话存在的时候,大模型可能并不能从这里面找到合适的内容联系,越早存在的问答对,其可能被关联回复的机率反而可能是越小的。**

当然,随着模型基础能力的提升,这一点并不绝对。

图片

再说说Messages中的示例:

如果有查看过一些模型的API,就会发现,很多聊天大模型中用户使用的“示例”部分,其实也是Messages中对话的一部分。

毕竟示例本身一问一答的模式,就是个模拟用户和大模型对话的问答对组合。

通常来说,使用示例的目的是为了约束大模型回复的效果。换句话说,就是给大模型的回复打个样。

但是,如果模型本身推理能力不够强的话,可能再怎么打样也是白瞎。

这种情况,小模型里比较多见,开源模型参数比较大的,或者大多数的闭源模型,情况一般都不会太糟。

同样,说点你可能不知道的:

有时候我们希望模型达成指定的一些回复,比如希望用户说"1"的时候,模型回复"0",但在实际应用中,模型很可能对一些特定的例子作出一些奇怪的回复,这个时候,把这些特殊的例子做成示例,就能很好地避免这种奇怪的问题出现,因为模型在遇上相同的问题的时候,优先会参考示例进行回答

图片

再说一说Messages中的System设定:

大多数模型中都会有这个System,主要是用来进行背景提示、系统设定、角色规则设定、回复要求制定等等。

如果有留意过市场上的一些聊天大模型的应用,有很多应用都是利用这个System的Prompt来达成的,效果也是立竿见影。

图片

这个参数在Messages里的地位也比较特殊,比起上面的对话和示例而言,它对大模型的回复影响要重要得多。通常情况下,它在每次发往聊天大模型的Messages里只会同时存在一个。

同样的,自然也存在一些不通常的情况,比如,有些模型就没法进行System设定,再比如,既然没有硬性规定只许一个System的存在,那在使用某些模型的时候,可以一次制作2个或更多个System,居然大模型也不会有异常……

不得不说,某些公认的比较强力的聊天大模型,在某些时候,还是值得我们依赖的。

也说一些你可能不知道的东西吧:

大语言模型毕竟是程序语言的产物,尽管按照自然语言做过很多处理,但在很多大模型中,这种痕迹是刻在骨子里的。System在聊天大模型中其重要性和特殊性又如此明显,所以,在市面上流行的一些模型中,将System处理成按照程序语言的一些要求或者格式输入的内容,尽管意思相同,但可能System的效果更好哦!

图片

多模态的出现丰富了Messages携带的内容,目前一些附带有多模态能力的聊天大模型中,文件、图片等内容都提供了特殊的参数,并作为Messages中某个Role的一部分内容存在,比如国内的Kimi模型,或者Openai新出且火遍全球的4O模型。

不过现阶段,Role目前仅仅只包括用户(User)和大模型(Assistant),System暂时还没见过可以这么玩的。

也说点你可能不知道的东西吧:

多模态这个能力,目前在不同的平台不同的模型上会有不同的处理,但由于牵涉到额外的资源文件,所以在使用的时候有可能会导致额外的token费用(比如4o),或者资源文件的上传数量限制(比如Kimi)。有时候甚至还需要额外的方案来支持,比如某些模型会提供专门的资源文件上传方案。

说了这么多,“Messages”这个参数,现在你觉得怎么样?

其他3个参数,且听我下回分解!

如何学习AI大模型?

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值