大语言模型——自检与自反（Self-Check / Self-Reflect）详解

DuHz

已于 2025-03-13 10:00:04 修改

阅读量680

点赞数 17

文章标签：语言模型人工智能自然语言处理机器学习算法信号处理神经网络

于 2025-03-03 22:10:33 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44648285/article/details/146000972

版权

引言

在传统的大语言模型推理中，模型给出一次性答案（One-Shot Answer）后就结束。然而，对于多步推理或复杂逻辑，模型常因内在的幻觉或知识缺陷而产出错误。为此，人们提出自检（Self-Check）与自反（Self-Reflect）的方法，让模型在输出初稿后再次审视自己的思维链和答案，找到可能的错误并进行修正。这一过程类似于人类在解题后的“复查”、或在写作后的“审稿”环节，可大幅提升大语言模型在复杂任务上的可靠度和可解释性。

基本概念与动机

自检（Self-Check）
- 当模型完成初次回答后，再次让模型检查其回答及推理过程；
- 如果发现逻辑矛盾、计算错误等，就在新一轮输出中改正；
- 目标：在保持快速生成的前提下，获得额外纠错机会。
自反（Self-Reflect）
- 让模型充当“批评者/审阅者”角色，深度审视自己的推理步骤与结论；
- 可能在逻辑结构上作再次组织或调整；
- 常见提示示例：“请你像一名审稿人一样，阅读并指出现有答案的错误或改进点”。
动机
- 减少大语言模型“一次性”回答可能带来的错误；
- 利用大语言模型在大段上下文中“阅读自身输出、并进一步推理”的能力，通过迭代来提高准确度。

自检与自反的多阶段推理框架

1. 定义与符号

为更好地刻画自检与自反的过程，引入如下符号：

$Q$ ：问题或输入（可以是自然语言问题、指令等）；
$Y^{(t)}$ ：模型在第 $t$ 阶段的输出，常含有思维链 $C^{(t)}$ 和答案 $A^{(t)}$ 。
$Y^{(t)} = (C^{(t)}, A^{(t)})$
$\Theta$ ：大语言模型的参数（在应用时通常固定）。

在自检与自反流程中，模型不止生成一次输出，而是可以进行多轮迭代 $\dots, T)$ 。

2. 自检（Self-Check）过程

最简单的自检通常只进行一次后验检查：

初次回答：
$Y^{(1)} = \arg \max_{Y} P_\Theta\bigl(Y \mid Q\bigr).$
这一步就是模型常规地回答问题。
检查与修正：
将 $Q$ 与 $Y^{(1)}$ 及提示文本（例如“请检查前述回答，若有错误请修正”）一起输入模型，让其生成第二个答案：

最低0.47元/天解锁文章

博客等级

码龄6年

468
原创

1万+
点赞

1万+
收藏

5717
粉丝

关注

私信

热门文章

最新评论

现代谱分析方法——前向-后向方法详解
软件老兵: 不好意思是我错了，就应该是这么算的。不能简单乘积，前面观测不一样乘积系数不一样。我修改了一下python程序中的输入O，依次改成：[0],[1],[0,0],[0,1],[1,0],[1,1],[0,0,0],[0,0,1]等等，就会发现规律。[0]+[1]的概率等于1，[0,0]+[0,1]的概率等于[0]的概率，[1,0]+[1,1]的概率等于[1]的概率。下一层的各种可能总概率只和等于上一层的概率，任意时间所有可能观测累加总概率是1。
现代谱分析方法——前向-后向方法详解
DuHz: 前向算法并不是“并不会根据观测序列去改变不同时刻的状态概率”，前向算法的计算依赖于观测序列。其次，前向算法的状态概率不仅会由初始状态概率和状态转移概率决定，还会受到观测序列对每个时刻的影响。并且观测序列的总概率并不是各时刻状态概率的乘积，而是通过对所有时刻的状态概率求和得到的
现代谱分析方法——前向-后向方法详解
软件老兵: 引用「α 1 (i)=π i b i (O 1 ),for i=1,2,…,N」前向算法并不会根据观测序列去改变不同时刻的状态概率，不同时刻状态概率是由初始状态概率和状态转移概率决定的。不同时刻t的各状态概率确定后，计算该时刻t被观测为k的概率，观测序列总概率为不同时刻概率的乘积。
稀疏模型（Sparse Models）——稀疏贝叶斯学习方法详解
DuHz: Laplace Prior是L1范数先验，估计稀疏信道时识别非零系数更厉害些，Student-t Prior一般适用信道中有较强噪声或异常值的情况。ARD（自动相关分布）是近似推断方法，肯定会损失精度的，但可以提高效率
稀疏模型（Sparse Models）——稀疏贝叶斯学习方法详解
2201_75418629: 自己目前在学稀疏信道估计方面，所以想看看贝叶斯估计在这方面的一些应用

最新文章

2025

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

DuHz 喜欢就支持一下 ~ 谢谢啦！

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。