推理大模型的后训练增强技术-Reasoning模型也进化到2.0了,这次居然学会用工具了
致Great ChallengeHub 2025年03月17日 22:17 北京
论文题目:START: Self-taught Reasoner with Tools
论文链接:https://arxiv.org/pdf/2503.04625
论文简介
Reasoning模型也进化到2.0了,这次居然学会用工具了!✨ 最近有个叫START的方法,让大模型也能学着用工具,比如自己调用代码解释器,来提升推理和解决问题的能力。
具体怎么实现的呢?它会