AI大模型原理(通俗易懂版)——调教ChatGPT

传送门:AI大模型原理(通俗易懂版)-CSDN博客

你有没有发现ChatGPT等AI聊天助手有时候像个博览群书又善解人意的天才,有时候像个喝了二两酒后前言不搭后语的笨蛋。针对这种现象,越来越多人开始研究怎么调教出一个聪明的AI聊天助手。

提示工程就是研究如何提高和AI的沟通质量,其核心关注提示的开发和优化,提示就是我们给AI聊天助手输入的问题或指令,AI会根据提示内容给予回应。在进入提示工程之前,我们先要了解ChatGPT等聊天助手存在的局限性,它们背后的大语言模型是用海量文本训练出来的,因此擅长模仿人类语言表达也从那些内容里学到了不少知识。他们的回应都是根据提示以及前面以生成的内容,通过持续预测下一个token的概率来实现的。

但同时对于它们不了解的领域,它们并不知道自己缺乏那方面的知识仍然在使劲猜测后面应该说什么,加上生成过程中也没有反思能力,所以我会经常看到胡说八道的同时还充满着自信。

为了调教AI,给出想要的回答,第一个办法是用小样本提示,我们很多时候都是直接丢问题或指令给AI。这种属于零样本提示就是没有给AI任何示范,不一定和我们想要的效果相符。但如果我们让AI回答钱给它几个对话作为示例,用样本对他进行引导,AI模型就会利用上下文学习能力。一方面记忆那些内容作为知识,另一方面像示范那样模仿着进行回应。有了小样本提示后,在问AI类似的问题,它就能给出和提示示范相似的回答了。小样本提示的另一个好处是,由于AI回应的内容风格会大概率遵循我们给的示范,
我们也就不用多费口舌给AI提要求,可以让他自行从前面的示范回答里领悟。但小样本提示有时也起不到很大的作用,比如AI非常不擅长做数学相关问题,即使我们用样本示范一些正确的结果到他做的时候依然掉链子。比如这个例子里面所有奇数相加后的结果是41,不是37,但问题在于AI生成每个token所用的时长是差不多的,不会因为某个词需要涉及更多的思考而花费更多时间生成那个token。所以计算结果就被他乱拉过去了,前面有正确的示范答案也没有什么帮助。

这种时候可以借助思维链。最早是谷歌在2022年一篇论文里提出的,作者发现思维链可以显著提升大语言模型,进行复杂推理的能力,特别是在算术常识符号推理等任务上运用思维链的方法。我们给AI的小样本提示里不仅包含正确的结果,也展示中间的推理步骤。那AI在生成回答时也会模仿着去生成一些中间步骤,把过程进行分解。这样做的好处是步子小点儿,不容易扯着。就像被老师点名回答问题时站起来瞬间就给出正确答案的难度系数很高,但如果是多说些废话,把思考步骤也讲出来,一方面可以拖时间,有更多思考机会,另一方面也有助于我们分步骤向更有机会得到正确答案。思维链也可以用在数学计算之外的很多方面,借助思维链,AI可以在每一步里把注意力集中在当前思考步骤上减少上下文的过多干扰。因此针对复杂的任务有更大概率得到准确的结果。

在思维链的相关论文里,作者还提到,即使我们不用小样本提示,只是在问题后面加一句let's think step by step让我们来分步骤思考,也能提升AI得到正确答案的概率,这是一种成本非常低的方法。用思维链还需要我们想样本示范,而这种方法只需要加上简单一句话,AI就会自行生成中间步骤进行推理。懒人福音,你学会了吗?这些提示技术能帮你更好的调教AI聊天助手。

  • 11
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值