COT（思维链）指令微调，幻觉解释

李小星同志

已于 2024-04-16 19:02:32 修改

阅读量296

点赞数 3

文章标签：机器学习

于 2024-04-11 21:12:29 首次发布

本文链接：https://blog.csdn.net/LI_XIAO_XING/article/details/137653419

版权

本文介绍了如何通过prompt、微调以及各种技术策略（如多样化数据、正则化、对抗性训练等）来优化深度学习模型，降低AI在图像识别中出现幻觉的可能性，提高模型的鲁棒性和准确性。

摘要由CSDN通过智能技术生成

cot(ai鼓励师？)给ai“let think step by step”之后表现变好了。

用短句子提示推理步骤

prompt是指为了训练特定类型的语言模型而设计的一系列文本或代码提示。prompt可以看作是一种能够帮助语言模型更好地理解特定任务或领域的“指令”。prompt通常包括一个问题、任务描述或预定义的文本片段，用于指导模型生成合适的文本结果。融入了Prompt的新模式大致可以归纳成”pre-train, prompt, and predict“。在该模式中，下游任务被重新调整成类似预训练任务的形式。例如，通常的预训练任务有Masked Language Model，在文本情感分类任务中，对于 “I love this movie.” 这句输入，可以在后面加上prompt “The movie is ___” 这样的形式，然后让PLM（预训练语言模型）用表示情感的答案填空如 “great”、“fantastic” 等等，最后再将该答案转化成情感分类的标签，这样以来，通过选取合适的prompt，我们可以控制模型预测输出，从而一个完全无监督训练的PLM可以被用来解决各种各样的下游任务。

微调（fine-tuning）和prompt是自然语言处理领域中常用的两个术语，它们都是指训练和生成语言模型的过程中使用的技术。

微调是指在已有的预训练语言模型基础上，通过少量的数据来对模型进行进一步的训练，使得模型能够更好地适应新的任务或领域。微调的目的是利用已有的语言模型，尽量减少训练新模型的时间和资源消耗。因此，微调是一种快速迁移学习的方法。

而prompt是指为了训练特定类型的语言模型而设计的一系列文本或代码提示。prompt可以看作是一种能够帮助语言模型更好地理解特定任务或领域的“指令”。prompt通常包括一个问题、任务描述或预定义的文本片段，用于指导模型生成合适的文本结果。融入了Prompt的新模式大致可以归纳成”pre-train, prompt, and predict“。在该模式中，下游任务被重新调整成类似预训练任务的形式。例如，通常的预训练任务有Masked Language Model，在文本情感分类任务中，对于 “I love this movie.” 这句输入，可以在后面加上prompt “The movie is ___” 这样的形式，然后让PLM用表示情感的答案填空如 “great”、“fantastic” 等等，最后再将该答案转化成情感分类的标签，这样以来，通过选取合适的prompt，我们可以控制模型预测输出，从而一个完全无监督训练的PLM可以被用来解决各种各样的下游任务。

什么是AI幻觉？

AI幻觉通常发生在深度学习模型，特别是卷积神经网络（CNN）中，这些网络在处理图像和视频识别任务时可能会错误地识别图像中的噪声或模糊的形状为清晰的对象。例如，一张纯粹由随机像素组成的图像可能被AI识别为一只猫或其他具体的物体。

为了避免AI幻觉，可以采取以下方法：

1. 多样化数据集：确保训练数据覆盖尽可能广泛的情况和变异，从而减少模型对于特定数据特征的过度敏感性。

2. 数据增强：通过旋转、缩放、裁剪或改变图像的颜色和亮度等手段增加样本的多样性，帮助模型学习到更加泛化的特征表示。

3. 使用正则化技术：

- Dropout：在训练过程中随机“关闭”一部分神经元，这有助于防止模型对少数特征的依赖，增强模型的泛化能力。

- 权重衰减（L2正则化）：通过对模型的权重进行约束，避免过大的权重值，减少模型的复杂度。

4. 对抗性训练：

- 引入对抗样本：故意生成会误导模型产生错误输出的样本，并将这些样本包含在训练数据中。这种方法可以使模型在面对潜在的幻觉触发数据时更为鲁棒。

5. 模型架构的改进：

- 引入注意力机制：通过注意力机制，模型可以更聚焦于图像的关键部分，减少被无关背景信息误导的可能。