大模型LLM的数学推理

orange_の_呜

已于 2024-03-29 12:35:10 修改

阅读量1k

点赞数 6

文章标签：笔记人工智能自然语言处理 python llama

于 2024-03-28 22:41:46 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_46268825/article/details/137119197

版权

文章探讨了MathPile预训练数据集在数学问题解决中的应用，涉及算术、几何、自动定理证明等内容，强调模型需处理文字与图形的结合以及逻辑推理。此外，还提及了MINIF2F等项目对逻辑分析和知识库支持的需求。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

结论

先尝试问题-论证-答案中的PRM800K数据集
MathPile是个用于预训练的语料库
paper & 知乎

1 算术

例如:
在这里插入图片描述

2 数学文字题

2.1 问题-答案

直接给出答案
在这里插入图片描述

2.2 问题-方程式-答案

给出解答的方程式（过程）
在这里插入图片描述

2.3 问题-论证-答案

给出论证的过程（应该含有方程式）
在这里插入图片描述

综上，考虑到视频的可视化过程，着重问题-方程式-答案和问题-论证-答案
PRM800K is a process supervision dataset containing 800,000 step-level correctness labels for model-generated solutions to problems from the MATH dataset.

3 几何

相对于文字，几何还需要模型对形状、大小及其相互关系的空间理解。
图中蕴含很多文字中不具备的复杂信息，模型需要解析图表的信息，也就是说模型要同时理解文本和图，具备跨模态的数值推理。几何体的解答既有多模态又有逻辑推理。
或者，对于manim，可以对几何形状进行描述，从而避免输入图像prompt 那么关于几何的问题，是不是就能归类为问题-论证-答案呢？？

4 自动定理证明

实现对给定推测的自动化推理证明，需要深刻理解语言+逻辑分析+广泛的知识库支持。
MINIF2F包含一系列复杂的奥林匹克数学问题, 旨在评估定理证明系统.

视觉-语言环境中的数学

即指模型对图表的理解，例如MathVista和ChartQA
暂时不考虑图像prompt的输入。
在这里插入图片描述

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。