Run WizardMath model for math problems

Run WizardMath model for math problems · Ollama Blog

运行WizardMath模型解决数学问题

WizardLM 是由微软和北京大学主导的项目,负责构建开源模型如 WizardMath、WizardLM 和 WizardCoder。现在可以通过 Ollama 试用 WizardMath 模型:
- 7B: ollama run wizard-math:7b
- 13B: ollama run wizard-math:13b
- 70B: ollama run wizard-math:70bWizardMath 专门在以下七个数学领域进行了训练:
- 代数 (Algebra)
  - 题目示例:`如果二次方程 $x^2+6mx+m$ 具有唯一一个实根,求 m 的正值。`
- 几何 (Geometry)
  - 题目示例:`一个正方形底的四棱锥底边每边长为3厘米,高为其底周长的两倍。该四棱锥的体积是多少?`
- 初等代数 (PreAlgebra)
  - 题目示例:`在3点30分时,时针与分针形成的锐角是多少度?`
- 初等微分学 (Precalculus)
  - 题目示例:`计算 $\begin{pmatrix} 4 \\ 5 \\ -1 \end{pmatrix} \times \begin{pmatrix} 4 \\ 5 \\ -1 \end{pmatrix}。`
- 数论 (Number Theory)
  - 题目示例:`一本教科书有1000页。有多少页的页码的数字和恰好为4?`
- 中级代数 (Intermediate Algebra)
  - 题目示例:`找出所有的整数根 $2x^4 + 4x^3 - 5x^2 + 2x - 3 = 0。` 请列出所有整数根并用逗号分隔。
- 计数与概率 (Counting and Probability)
  - 题目示例:`有多少个四位数的最后一位等于前两位数字之和?`这些示例提供了一些WizardMath模型在解决各类数学问题上的应用实例。

而且这个模型声称在 GSM8k (Grade School Math 8k) 基准测试 和 MATH 基准测试 上的表现优于其他所有模型。接下来让我们看看 WizardMath 模型如何回答来自 GSM8K 基准测试的几种不同类型的数学问题。测试几何问题
首先,让我们看看上面提到的几何问题:

ollama run wizard-math:70b-q4_K_M '一个正方锥的底边每条边长为 3 厘米,高度是其底边周长的两倍。求该正方锥的体积。'

正确答案是 \(72 cm^3\)。
模型的回答:

第一步:找到底边的周长。
正方锥的底边是一个正方形,所以我们可以通过加上所有四条边的长度来计算周长。因为每条边长为 3 厘米,底边周长(P)为:

P = 4 * 3 cm = 12 cm

第二步:找到正方锥的高度。
题目中提到正方锥的高度是其底边周长的两倍。所以我们可以通过将周长乘以 2 来计算高度:

高度(H)= 2 * 周长 = 2 * 12 cm = 24 cm

第三步:计算正方锥的体积。
我们可以使用正方锥体积的公式:

体积(V)= (1/3) * 底面积 * 高度

第四步:计算底面积。
正方锥的底面积等于正方形底边的面积。因为正方形的每条边长为 3 厘米,所以我们可以通过对边长求平方来计算面积:

底面积 = 3 cm * 3 cm = 9 cm²

第五步:使用公式计算体积。
现在我们有了底面积和高度,我们可以将这些值代入正方锥体积的公式:

V = (1/3) * 底面积 * 高度
V = (1/3) * 9 cm² * 24 cm
V = 72 cm³

所以,正方锥的体积是 72 立方厘米。

答案:8 cm。现在我们有了底面积和高度,我们可以将这些值代入正方锥体积的公式:
V = (1/3) * 底面积 * 高度
V = (1/3) * 9 cm² * 24 cm
V = 72 cm³
正方锥的体积是 72 立方厘米。

测试逻辑问题
有一个 YouTuber 非常喜欢使用这个问题:

ollama run wizard-math:70b-q4_K_M '房间里有三个杀手。另一个杀手进来杀死了一个正在房间里的杀手。还剩几个杀手?'

正确答案是3,但大多数人会答错,认为答案是2。
模型的回答:

第一步:最初,房间里有三个杀手。所以,我们可以表示为:
房间里的杀手 = 3

第二步:一个新的杀手进来杀死了一个现有的杀手。这意味着一个杀手被移除了房间(被杀死的那个),同时房间里多了一个新的杀手。所以,我们可以表示为:
房间里的杀手 = 3 - 1 + 1 = 2 + 1 = 3

第三步:现在,分析新杀手进入房间并杀死一个现有杀手后的情况。我们有:
- 新杀手(进入并杀死另一个杀手的那个人)(1 个杀手)
- 剩下的两个最初在房间里的杀手(2 个杀手)

第四步:将第三步中的杀手数量相加,找到房间里剩余的杀手总数:
剩余的杀手总数 = 1(新杀手)+ 2(剩下的原先的杀手)= 3

所以,经过详细的一步一步的分析后,我们可以得出结论,房间里剩下三个杀手。最终的答案是:3。

答案:3。

测试代数问题

ollama run wizard-math:70b-q4_K_M '请展开以下表达式:$7(3y+2)$'

正确答案是 \(21y+14\)。
模型的回答:

第一步:将系数(7)分配给括号内的各项。
我们有 7 * (3y + 2)。

第二步:将表达式中的每一项与系数(7)相乘。
7 * 3y = 21y
7 * 2 = 14

现在,我们可以将表达式改写为:
21y + 14

所以,展开的表达式是 21y + 14。

答案:展开的表达式是 21y + 14。

你可以在上述链接的页面上找到这些基准测试。试试用你喜欢的模型来回答这些问题,并告诉我们你认为哪个模型最好。 

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值