在大型语言模型开发中,主要分为两种类型的LLM(large language model)。分别是 base LLM和instruction tuned LLM(指令调整LLM),下文会着重后者进行指令表达的学习。
指令调整LLM基于在被大量文本训练过的base LLM,使用输入输出的指令来进行调整。同时使用RLHF(人类反馈强化学习)进一步优化,让模型更好得遵循指令。
提示指南
为了编写有效的提示词,以下是两个提示指南:
输入清晰且具体的指令
提示词应该简洁明了,使用明确和具体的指令表达希望模型做什么,不要有任何歧义。尽可能避免使用模糊、主观或具有多种解释的词语。
想要编写清晰且具体的指令,可以遵循以下几点:
- 多使用
delimiter
分界符号,表达输入的不同部分:
- 三引号: “””
- 三反引号: ```
- 三破折号: —-
- 尖括号: <>
- xml tags:
- 要求结构化输出
为了让模型解析输出结果更容易,可以让模型输出如HTML, JSON等结构化的输出结果
- 要求模型检查是否符合条件
当任务存在假设未被满足,可以要求模型去检查这些假设,再去觉得是否终止任务
- 少量训练提示
要求模型执行任务前,先给予成功执行的例子。如下:
提示词:
注意:以下回答为模仿父亲的语气回答儿子的问题。
<儿子> 什么是耐心?
<父亲> 耐心就是坚持不懈。
<儿子> 什么是坚韧?
模型回答:
<父亲> 坚韧就是在面对困难和挑战时,不放弃,继续前行
想尝试使用提示模型可以通过二维码添加微信,国内,稳定,3点5~4