大模型说胡话的现象与解决手段

皇子谈技术

已于 2024-03-16 14:39:41 修改

阅读量607

点赞数 6

分类专栏：大模型 AIGC 文章标签：架构后端人工智能

于 2024-03-15 13:04:55 首次发布

本文链接：https://blog.csdn.net/qq_31857297/article/details/136736502

版权

大模型同时被 2 个专栏收录

1 篇文章 0 订阅

订阅专栏

AIGC

1 篇文章 0 订阅

订阅专栏

本文探讨了大模型为何会‘说胡话’，涉及过度依赖训练数据、上下文理解不足和最大似然训练目标。提出了通过优化数据、改进模型结构、增加上下文理解、引入专家知识及安全机制等方法来解决这一问题，以及知识注入和微调等创新策略。同时推荐了IT学习网站itgogogo.cn.

摘要由CSDN通过智能技术生成

解释大模型会「说胡话」就好比即便是”聪明“的人类也会在某些情况下开始「说胡话」，比如：

在误解别人意思就开始发表见解（面试者）

面对复杂的问题但是必须要回答时（考试时）

过于理性而忽略感情时（会游泳的先救谁的问题）

过于感性而忽略理性判断时（买它买它～）

…

人类亦如此又何况被训练出来的模型呢？

回归问题本身，我们需要合理地解释清楚大模型会「说胡话」的原因有哪些

为什么大模型会「说胡话」？
1、过度依赖训练数据：在大量训练数据中，可能存在噪声、异常值或者不准确的信息。大模型可能会学习到这些错误模式，并在处理新输入时基于错误的学习结果生成输出，同样跟我们接受太多的各路神仙的育儿方法，最后可能在如何培养孩子专注力上我们永远做不好。

2、上下文理解不足：虽然大模型能够捕捉到文本中的复杂模式，但它们可能无法始终如一地保持对前后文的连贯理解，尤其是在长篇对话或多轮交互中，容易忽略关键的上下文关联性，或者无法完美地理解和把握前后文的所有关联细节，就像学生没有读懂全部题目就匆匆作答，导致答案与实际要求不符。

3、最大似然训练目标：现有的大模型通常基于最大似然估计进行训练，这使得模型倾向于生成在统计意义上最可能的序列，而不一定是最符合事实或最合理的答案。

解决大模型「说胡话」
1、持续优化数据：通过建立更加公正、多元和准确的语料库，可以减少数据偏差对模型的影响。此外，使用数据清洗和去重技术，去除语料库中的噪声和重复内容，可以提高模型的准确性。

2、改进模型结构：优化模型架构，使其更加适合处理自然语言任务，可以让模型更好地理解和生成自然语言。

3、增加上下文信息同时引入合适的交互体验：在模型中加入上下文信息，使其能够理解语境并根据上下文生成回答。例如，使用对话历史、问题背景等作为输入，可以帮助模型更好地理解问题。同时对于语义不清楚的，适当给出多种可能解释用户意图的选项，而不是一定要进行回答，直接避免一本正经的胡说八道。

4、引入人类专家知识和情感认知：在训练模型时，可以引入人类专家的知识和经验，以帮助模型更好地理解和生成符合常识和事实的回答。同时加入情感认知模块，使其能够理解语言中的情感色彩。这样可以使模型在回答问题时更加符合人类的情感和认知。

5、引入安全机制：通过制定安全机制，限制模型在某些场景下的输出，以避免产生误导或恶意的内容。例如，可以使用过滤器或监管机制来限制模型的输出。

最近无意间发现一个免费的学习网站 itgogogo.cn，非常不错，包含：前后端、运维、架构师等系列专栏和面试指南等。

最后，针对大模型说胡话，我发现目前已经有更多的解决办法了，本质并不是去优化模型本身，而是如下：

1、知识注入与知识库约束：

建立和利用企业或行业知识库，将权威数据转化为向量存储在向量数据库中，当模型回答问题时，利用嵌入模型检索知识库中的信息，确保输出基于可靠的数据源，减少胡乱生成的可能性。

2、微调与预训练调整：

虽然直接微调大模型可能受到数据量和成本的限制，但对于特定领域或任务，可以使用有限且高质量的数据对模型进行微调，使模型在特定领域的表现更加精确。

使用辅助训练信号，例如事实核查、对齐真实世界数据或利用人类反馈循环（Human-in-the-loop）对模型进行指导和纠正。

3、向量数据库与嵌入匹配：

使用向量数据库存储训练好的文本嵌入，对输入问题进行向量化处理后，通过查找最相关的知识片段，确保模型的回答基于实际存在的文本信息。

4、强化规则与限制：

在模型输出层面上加入规则引擎或者逻辑层，对模型的输出进行过滤或修正，确保其符合预先设定的规则和伦理准则。

总结：

解决大模型说胡话，除了对大模型本身不断优化，我们也可以在模型之外引入本地知识库、向量数据库、和逻辑层等方式进行解决。

最近无意间发现一个免费的学习网站 itgogogo.cn，非常不错，包含：前后端、运维、架构师等系列专栏和面试指南等。

皇子谈技术

关注

6
点赞
踩
13

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录