LLM-2023:Toolformer【以自监督的方式微调语言模型,在不失模型的通用性下,让模型学会自动调用API。通过调用一系列工具在各种下游任务中实现了实质性改进的零样本性能】

Toolformer是一种自监督方法,用于微调语言模型以自动调用API,提升零样本性能。在不牺牲模型通用性的前提下,通过调用多种工具,如搜索引擎和计算器,Toolformer在多项任务中表现出显著改进。文章介绍了数据集增强、微调和推理过程,并展示了在LAMA、数学推理和多语言任务等场景中的实验结果。
摘要由CSDN通过智能技术生成

[2302.04761] Toolformer: Language Models Can Teach Themselves to Use Tools (arxiv.org)

1. 简介

大型语言模型在各种任务上实现了令人深刻的零样本和少样本结果,但是仍存在一些局限性,包括无法获取最新信息,幻觉倾向,精确计算,不知道时间的推移等。

克服这些限制的一个简单方法是让它们能够使用搜索引擎、计算器或日历等外部工具。然而,现有的方法要么依赖于大量的人工注释,要么仅将工具的使用限制在特定任务的设置中,阻碍了在LMs中更广泛地使用工具。

在本文中,作者提出了Toolformer,以自监督的方式微调语言模型,在不失模型的通用性下,让模型学会自动调用API。通过调用一系列工具,包括计算器、问答系统、搜索引擎、翻译系统和日历,Toolformer在各种下游任务中实现了实质性改进的零样本性能,通常可与更大的模型竞争,而不

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值