✨继续阅读报告:使用大模型来学习推理(Reason)
原文链接:https://openai.com/index/learning-to-reason-with-llms/
这次我们继续看一个填字游戏的案例。
我们先看下问题:
解决以下填字游戏:
Across(横向):
1 Evade 中文:躲避2 One to close envelopes 中文:封信封的工具
3 Mother ______ 中文:母亲______
4 Initiated people 中文:启蒙人们
5 Native American tent 中文:美洲原住民的帐篷
6 Mistakes 中文:错误
Down(纵向):
1 ______ car (Station wagon) 中文:______车(旅行车)2 Automatic planting machine 中文:自动种植机
3 Profession 中文:职业
4 Syrian and Turkish pepper variety 中文:叙利亚和土耳其的辣椒品种
5 Annoy 中文:烦恼
6 Deletes 中文:删除
先看下GPT4o的回答:
Let’s solve the crossword using the provided clues.
Across:
Evade - Dodge
One to close envelopes - Sealer
Mother ______ - Motherland
Initiated people - Insiders
Native American tent - Tepee
Mistakes - Errors
Down:
______ car (Station wagon) - Family
Automatic planting machine - Seeder
Profession - Career
Syrian and Turkish pepper variety - Aleppo
Annoy - Irritate
Deletes - Erases
Here’s how the crossword would look filled in:
【小梦备注:emm,一眼错误,也不需要逐行翻译了,基本它把这题目当成一个寻找近似词了,几乎完全没有管字符数量和字符之间关系的事情了。】
接下来是OpenAI O1 preview上场。
首先是CoT部分:
我们被要求解决这个填字游戏谜题。
让我们首先理解这个格子:
- 这是一个6x6的格子,从1到11的位置编号如下:
【小梦备注:首先读了一遍题目,仔细审题并尝试理解结构,是个好习惯。】
所以横向的条目编号为1到6,纵向的条目从1到11。
但实际上,线索是:
横向