2024/5/16 英语每日一段

"Our research confirms prior work showing this sort of 'chain-of-thought' prompting can make language models think in more structured ways," Timothy Merino, another PhD student at the Game Innovation Lab who was a co-author of the study, said in a statement. "Asking the language models to reason about the tasks that they're accomplishing helps them perform better." Studies like this help researchers benchmark AI capabilities, and they may also explore the potential for models like GPT-4 to be used in the production of novel word puzzles in the future.

翻译:该项研究的合作者,游戏创新实验室的另一位博士生TM在一份声明中说:我们的研究证实了之前的研究,在,这种思维链提示能让语言模型以更加结构化的方式思考。

要求语言模型就正在完成的任务进行推理会使得他们发挥更好的表现。

此类研究有助于研究人员对人工智能能力进行基准测试,他们还可以探索GPT-4等模型在未来用于制作新的单词谜题的潜力。

「词汇总结」

prompting - n. 提示,激励

structured - adj. 有结构的,有组织的

reasoning - n. 推理,推断

benchmark - n. 基准,标杆

capabilities - n. 能力,性能

language models - n. 语言模型

accomplish - v. 完成,实现

production - n. 生产,制造

novel - adj. 新颖的,小说的

puzzles - n. 谜题,难题

confirms - v. 确认,证实

prior - adj. 先前的,之前的

performance - n. 表现,性能

explore - v. 探索,探究

potential - n. 潜力,可能性

co-author - n. 共同作者

statements - n. 声明,声明

prompt - v. 提示,激励

structured - adj. 有结构的,有组织的

models - n. 模型,典型

potentially - adv. 可能地,潜在地

confirm - v. 确认,证实

「文章背景」

在国际象棋对弈方面,人工智能相对人类而言已占绝对优势,但是当面对基于语言的难题时,算法们表现如何呢?为了找到答案,纽约大学坦登工程学院的一组研究人员用《纽约时报》的日常文字谜题“连接”挑战各种现代自然语言处理系统,并总结和分析它们的表现。“连接”是一款文字游戏,玩家可以尝试五次,将16个单词分为四组,每组四个。分组问题的难度从“简单”(通过简单的定义连接)到“棘手”(通过更多批判性思维来关联抽象的单词)等。纽约大学游戏创新实验室的博士生格雷厄姆·托德在一份声明中表示:“大型语言模型正变得越来越普遍,研究它们在处理‘连接’难题中失败的地方可以揭示它们在处理语义信息方面的局限。”总而言之,人工智能很难完成“连接”谜题。GPT-4是受试模型中最成功的,但只解决了大约29%的问题,与人类一样,在面对“棘手”难度的“连接”题时极为挣扎。当GPT-4收到逐步引导其推理答案的提示时,表现稍好一些,达到39%。但人工智能离拿下这项游戏距离还很远。

  • 8
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值