论文笔记--Toolformer: Language Models Can Teach Themselves to Use Tools

Isawany

于 2023-11-26 19:50:35 发布

阅读量1.5k

点赞数 19

分类专栏：论文阅读文章标签：论文阅读语言模型 Toolformer gpt 自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38124427/article/details/134631393

版权

论文笔记--Toolformer: Language Models Can Teach Themselves to Use Tools

1. 文章简介
2. 文章概括
3 文章重点技术
- 3.1 Toolformer
- 3.2 APIs
4. 文章亮点
5. 原文传送门

1. 文章简介

标题：Toolformer: Language Models Can Teach Themselves to Use Tools
作者：Timo Schick, Jane Dwivedi-Yu, Roberto Dessì, Roberta Raileanu, Maria Lomeli, Luke Zettlemoyer, Nicola Cancedda, Thomas Scialom
日期：2023
期刊：arxiv preprint

2. 文章概括

文章给出了一种可以自动调用API的LLM方法“Toolformer”，该工具可以自行决定是否调用API，何时调用API以及调用什么API，从而达到通过API检索增强增加LLM回答的可靠性。

3 文章重点技术

3.1 Toolformer

给定语言模型 $M$ ，给定一系列可供调用的API接口 $c=(a_c, i_c)$ ，其中 $a_c$ 为API的名称， $i_c$ 为API的输入，API会返回结果 $r$ ，记 $a_c(i_c) \to r</API>)$ ，其中 $\to$ 表示特殊token，用于区分API的输入和输出。给定数据集 $\mathcal{C} = \{x^1, \dots, x^{|\mathcal{C}|}\}$ ，其中 $x^i$ 表示输入的文本。则Toolformer按照如下的步骤进行训练、推理：

Sampling API Calls：首先，对每个API接口，我们设计一个对应的prompt“ $P (x)$ "让模型自动改写原始输入为调用API的输入。如下图所示，对一个原始输入文本 $x$ ，对任意位置

最低0.47元/天解锁文章

博客等级

码龄8年

89
原创

265
点赞

281
收藏

169
粉丝

关注

私信

热门文章

分类专栏

吴恩达ChatGPT系列课程学习 9篇
论文阅读 80篇

最新评论

论文笔记--Skip-Thought Vectors
Isawany: 你试试从这下呢 http://mirror.nubenum.de/www.cs.toronto.edu/~rkiros/models/
论文笔记--Skip-Thought Vectors
xhns123: 博主好，看你的论文笔记学到了很多。我去下载skip-thought模型的时候，发现github上开源的下载链接失效了，不知道你保存了吗？如果保存了能否给我发个压缩包，万分感谢。903695886@qq.com
论文笔记--Llama3 report
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文笔记--kNN PROMPTING: BEYOND-CONTEXT LEARNING WITH CALIBRATION-FREE NEAREST NEIGHBOR INFERENCE
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文笔记--Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks
Isawany: 已更正，感谢～again

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。