大模型在线辅导小模型，正确率提50%、推理效率涨90%

程序员笑武

于 2025-05-02 10:45:00 发布

阅读量1.1k

点赞数 31

文章标签：语言模型人工智能自然语言处理 embedding 安全

本文链接：https://blog.csdn.net/m0_59164304/article/details/147639475

版权

想一下，一个刚学数学的小学生（小模型SLM），虽然做题快，但遇到复杂问题就容易卡壳。而博士生导师（大模型LLM）知识渊博，但计算成本高。

论文：Guiding Reasoning in Small Language Models with LLM Assistance
链接：https://arxiv.org/pdf/2504.09923v1

论文的突破点在于：让小学生自己尝试解题，只在关键步骤（比如解方程或逻辑推理）时，导师才出手指导。这种“外挂大脑”模式，就是SMART框架的核心。

小模型自主推理，大模型在错误步骤处介入

SMART框架：像老师辅导学生一样工作

三步流程

第一步：小模型自己写解题步骤（比如：“先算加法，再算乘法”）。
第二步：给每一步“打分”——用两种方法：
- PRM分数：像老师批改作业，直接判断对错；
- TLC分数：看小模型自己有多自信（比如概率高低）。
第三步：分数低于阈值时，召唤大模型修正这一步。

生成推理路径的概率公式：

简单说，就是每一步都依赖前面的步骤，像搭积木一样。

得分阈值τ：决定是否需要大模型介入的“分数线”。

框架流程图：生成→打分→修正循环

实验：小模型逆袭，接近大模型水平

论文用500道数学题测试，发现：

单次生成（N=1）：SMART让小模型正确率提升10-20%。
多次生成（N=32）：小模型能达到大模型90%以上的水平！
越难的题越明显：比如最高难度题（Lv5），小模型正确率从20%飙升至50%+。

不同难度等级下的性能对比表

关键发现

大模型只需修改约20%的步骤，就能大幅提升效果。
成本优势：相比全程用大模型，SMART的LLM调用量减少90%。

未来手机也能跑高级AI？

手机本地运行小模型，遇到复杂问题时联网求助大模型。
既保证响应速度，又降低流量费用。

展望

未来可能结合强化学习，动态调整“辅导频率”。
隐私保护：敏感数据留在本地，只上传必要问题。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述