大模型 | CoT 综述(二)任务类型、Prompt 设计

一、任务类型

在使用 CoT Prompts 时,任务类型是目标,也就是说在设计 CoT Prompts 之前,有必要明确哪些类型的任务更容易受到 CoT Prompts 的推动,或者说是不同任务类型如何影响 CoT 的有效性。

封闭领域推理和问答

  • 任务特点:这类任务要求模型在处理时要考虑所有必要的条件和背景知识。这意味着任务本身包含了完整的信息,模型需要从中提取有用的材料进行分析和推理。

  • 模型需求:模型在执行这些任务时,需要能够识别和选择那些与任务解决直接相关的关键材料。也就是说,模型要有能力从提供的背景信息中找到最重要的部分,然后基于这些关键材料进行推理,以得出正确的答案。

  • CoT Prompts 的作用:CoT Prompts 提供了一种推理模式或框架。这种框架能够引导模型逐步推理,帮助模型在复杂的任务中有效地选择和处理信息。

  • 应用场景:在特定任务中,比如数学推理、符号推理、表格问答等,使用 CoT Prompts 可以显著提升模型的表现。这是因为 CoT Prompts 能够帮助模型更好地组织和利用提供的信息,从而在这些任务中表现得更为优越。

开放领域推理和问答

  • 任务特点:这类任务需要模型基于一个大规模的、非结构化的知识库来回答问题。这意味着任务中没有提供所有必要的知识,模型需要依赖自己的知识储备来推导出答案。

  • 模型的挑战:由于问题中不包含所有的信息,模型需要利用自身已经掌握的知识来解决问题。这对模型的知识储备提出了很高的要求。如果模型的知识储备不够丰富或准确,推理出的答案可能也会不准确。

  • CoT Prompts 的依赖性:在这些任务中,CoT Prompts 的效果很大程度上依赖于大模型所掌握的知识的质量。如果模型的知识储备质量高,CoT Prompts 可以帮助模型更好地利用这些知识来逐步推理出正确的答案。

  • 语义理解的需求:某些任务要求模型对自然语言的语义有更深的理解。也就是说,模型不仅要掌握知识,还要能理解并正确解读语言中的复杂含义。

  • CoT Prompts 的限制:如果在这些知识或语义导向的任务中,不恰当地使用 CoT Prompts,反而可能会降低模型的性能。这可能是因为模型在这些任务中无法有效利用 CoT Prompts 提供的推理链条。

  • 解决方案:为了解决这个问题,一些研究尝试使用外部工具为模型注入所需的知识。这些工具可能帮助模型更好地掌握和利用任务所需的知识,从而提升 CoT Prompts 的效果。

代码生成

  • 代码生成旨在根据输入指令生成代码。由于代码的内部逻辑形式,CoT 的逐步推理链条与代码生成所需的能力相一致。

二、Prompt 设计

当任务类型确定后,就需要设计一个有效的 CoT Prompt。除了查询之外,CoT Prompt 中还有两个特殊元素:

  • CoT 示例(CoT Demonstrations)

  • 文本指令(Textual Instructions)

**CoT 示例是几个逐步推理的范例,而文本指令是用于积极引导逐步解决过程的文本序列。**一个 CoT Prompt 应至少包含这些元素之一。

通常,包含示例的 CoT Prompt 被称为 few-shot CoT,不包含示例的称为 zero-shot CoT。下图展示了三个 CoT Prompt 示例。

图 3:CoT 提示示例。

在 Few-shot 的 CoT 中,示例是必不可少的部分。如上图所示,它是一个(问题、理由、答案)三元组组成的 CoT Prompt,其中理由包含从问题到答案的中间推理步骤。

以下是在设计 Few-shot CoT Prompt 时的关键考虑因素:

1)复杂性:选择更复杂的问题示例,有助于延长模型的推理链,从而提升模型的推理能力。

2)相关性与多样性:

  • 相关性:确保示例与查询问题相似,可以帮助模型更好地模仿正确的推理模式。
  • 多样性:提供多样化的示例可以使模型的推理更加稳健,但过多示例可能引入噪声,影响性能。

3)结构完整性:推理链应包括关键逻辑元素(连接对象)和相应的语言模板,以确保推理的严密性和完整性。

4)数量与顺序:示例的数量和排列顺序会影响模型的性能。过多示例可能增加计算成本,而示例过少则可能导致模型对单一示例过度依赖。

大模型在 Zero-shot 的情境下也能遵循文本指令的能力已经得到过证明。所以,在 Zero-shot 的 CoT 中,可以显式通过文本指令,如“让我们一步一步地思考”,来引导大模型进行逐步的推理。即使没有示例,这种简单的零样本策略在某些任务中的效果也令人印象深刻,相较于非 CoT 的方法,表明这些文本指令能有效地引发 LLM 的推理能力。一些研究还发现,结合这些文本指令与 few-shot CoT,可以进一步提高模型的性能。


最后分享

AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。

学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。

这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!

1. 成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图方向不对,努力白费

这里,我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。可以说是最科学最系统的学习成长路线。
在这里插入图片描述

2. 大模型经典PDF书籍

书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。(书籍含电子版PDF)

在这里插入图片描述

3. 大模型视频教程

对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识

在这里插入图片描述

4. 大模型项目实战

学以致用 ,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。

在这里插入图片描述

5. 大模型面试题

面试,不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

在这里插入图片描述

全套的AI大模型学习资源已经整理打包,有需要的小伙伴可以微信扫描下方CSDN官方认证二维码,免费领取【保证100%免费

如有侵权,请联系删除。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值