大模型能力扩展之——提示词(Prompt)，知识库，思维链(CoT)和Agent(代理)

可乐鸡翅面

于 2024-10-03 16:45:00 发布

阅读量436

点赞数 8

文章标签： prompt 人工智能 chatgpt 机器人 java 数据库

本文链接：https://blog.csdn.net/weixin_72959097/article/details/142659799

版权

“ 大模型的推理能力配合外部工具才能真正发挥大模型的作用**”**

在学习和使用大模型的过程中，我们会发现大模型只能用来进行一下简单的问答；一旦涉及到复杂的问题，大模型就无能为力了。

其原因就在于我们并不会使用大模型，或者说不知道怎么发挥大模型的强大能力。‍‍‍

虽然很多人使用别人开发好的AI工具去生成一些文本，图像等内容进行创作；或者通过外挂知识库的方式来增强大模型的能力范围，但离真正发挥大模型的能力还差好远。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

—

怎么发挥大模型的能力？‍‍‍‍‍

对大模型的使用大致分为以下几种类型，入门级别可以简单使用大模型提供的聊天窗口进行问答来解决一些问题；再厉害一点的就是学会使用一些第三方基于大模型开发的一些AI工具。

而在更加高级的使用场景中，就不是普通人能够完成的了，这就需要有一定的技术和开发能力才能实现。‍‍‍‍‍

比如，自己搭建一个知识库，每次使用大模型的时候都会从知识库中获取知识输入到大模型，以获得更好的结果；而再高级一点的就是使用提示词+知识库+思维链+外部工具(API，功能代码等)来实现人类才能做到的事情。‍‍‍‍‍‍‍‍

举个例子，通过以上方式，告诉大模型给我规划一个三天两晚的短期旅程，并且要给出完整的可行性方案，还要让大模型帮你提取预定好酒店和门票等。‍‍‍‍‍‍‍‍‍‍‍

这个依靠大模型本身的能力是无法完成的，因此就需要使用外部工具，而这也叫做Agent(代理)技术。‍

_大模型知识来源_‍‍‍‍‍

我们都知道大模型有很强大的知识储备，在预训练阶段用于训练的数据越多，数据质量越好，大模型的性能就越好。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

一般来说，大模型的知识来源有三个方向，第一种就是大模型本身的知识储备，这些知识来源于预训练数据；这也是为什么大模型在不依靠任何外力的情况下就可以回答一些问题。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

但由于预训练的原因，大模型每次更新自身知识就需要重新训练或者微调；由于成本和技术原因就导致大模型自身知识更新不及时；这时就会出现一个问题，在涉及到大模型自身知识范围之外的问题时，大模型就会“一本正经的跟你胡说八道”。‍‍‍‍‍

因此就有了后面两种情况，第一种就是知识库，简单来说就是给大模型配置一个资料库。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

这样，大模型在遇到问题的时候就可以依靠自身的知识储备加上外部资料库的知识来回答问题。这样就间接解决了大模型知识更新不及时的问题。‍‍‍‍‍‍‍

但仅有知识库还不够完善，因为有些东西是动态改变的，比如说每天的天气情况，金融市场的交易情况等；这是知识库解决不了的问题，因此就需要给大模型配备外部工具，比如天气查询的API或者股票查询接口等。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

这时，大模型就可以利用其Function call的能力来调用外部工具来实现目的。‍‍‍

**Function call是在大模型之上封装的一层可以调用外部工具的一个方法，有些模型实现了Function call的功能，而有些模型没有实现这个功能，这时就需要你自己来实现。**‍‍‍‍‍‍‍‍‍

以上就是大模型知识的三个来源，根本不同的情景，大模型可能会使用自身的知识来解决问题；在自身知识解决不了的情况下就会使用知识库和外部工具的方式来解决——前提是配置了知识库和外部工具集。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

_Agent(代理)_‍‍‍‍‍‍‍

人工智能代理(AI Agent)，目前为止其并没有一个公认的定义；简单来说就是让大模型能够像真正的人类一样来完成更加复杂任务的一种方式和方法论。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

因为大模型虽然能力很强大，但从应用的角度来说它更像是一个“大脑”，它能够理解问题，思考问题，但没办法解决问题。‍‍

比如说我想出去玩，让大模型给我规划行程，这个是没问题的；但你让它帮你订票就有问题了，而这时Agent就出现了，它就是可以让大模型不但能帮你规划，还能帮你订票。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

提示词

使用过大模型的人都知道，提示词直接影响到大模型的表现；简单的提升词虽然也能让大模型完成任务，但往往完成的不是很好，甚至会有很大问题。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

而在专业的提升词工程中，大模型会有几个角色，一个是system(系统)角色，一个是assistant(助手)角色和user(用户)角色。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

system角色是来限定大模型定角色范围的，比如是老师，科学家，医生等，不同的角色会擅长不同的领域；而user角色就是我们使用者的角色，可以用来提出问题等；assistant角色就是大模型本身或者说是大模型回答user角色问题的“助手”。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

因此良好的提示词能够激发大模型的能力，比如其推理和规划的能力；提示词越详细大模型就能回答的越好。‍‍‍‍

比如说，在设计提示词时需要告诉大模型的角色，当前背景，需要完成的任务以及大模型回答的风格等。‍‍‍‍‍‍

您想要ChatGPT帮您写一篇关于气候变化的文章，最终的提示词可能是这样：‍

作为一个专业研究气候变化的科学家（CR：能力与角色），请基于当前的科学共识和最新的研究数据（I：洞察），撰写一篇详细且科学严谨的报告（S：陈述），内容需涵盖气候变化的原因、影响以及可能的解决方案。请采用客观且权威的写作风格（P：个性），并提供几种不同的结构和论点供选择（E：实验）

https://blog.csdn.net/qq_17827079/article/details/136475535

思维链

而仅有提示词功能还不足以完全发挥大模型的能力，因此又有了思维链(CoT)的出现，思维链的作用就是让大模型有一个完整的思考过程，并且可以给出一些案例，来让大模型处理更加复杂的任务。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

比如说，让大模型帮你设计一个详细的理财方案；虽然依靠大模型或者知识库的能力，大模型也能完成任务；但完成任务的效果可能就不是那么满意了。‍‍‍‍‍‍

因此，大模型就可以通过自身的推理能力以及外部工具，通过多次思考来完成这个任务。‍‍‍‍‍

比如说，你想要一个理财方案，第一步要评估当前的财务情况；第二步要明确理财目标；第三步要怎么具体实施等。‍‍‍‍‍‍

而这就需要借助大模型等推理和规划能力来制定一个详细的可行性方案。‍‍‍‍‍‍‍‍‍‍‍‍‍

思维链的作用就是让大模型像人类一样思考，一步一步的来完成任务。‍‍‍‍‍‍

外部工具(tools)

外部工具的作用就是让大模型可以实时获取当前的信息，比如股票的价格波动；以及能够借助外部工具自主完成任务，比如订票。‍‍‍‍‍‍‍‍‍‍‍‍‍

通过以上方式用户就可以创建一个具有某种功能的Agent，比如一个理财大师；而用户可以创建多个不同的Agent来互相协作，比如创建一个投资人的Agent，它能够根据当前的市场环境做出准确的投资决策；然后再创建一个软件开发的Agent，这样就可以让两个角色互相配合，软件开发的Agent复杂产品的设计和研发，投资Agent复杂做市场融资和市场开拓。‍‍‍‍‍‍‍‍

总结

大模型并不只是一个用来回答问题的机器人，通过提示词，思维链，知识库和工具集的合理配合，它能够发挥人们无法想象的威力。