Toolformer :让AI学会使用工具

paper: 《Toolformer: Language Models Can Teach Themselves to Use Tools

核心思想,

1. Sampling API Calls :设计设计prompt,让模型生成含API调用的文本(如图3),只保留K个概率最高的API调用

2. Executing API Calls: 然后执行这些API,拿回结果,

3. Filtering API Calls: 把这些结果插入到原文,如果API调用的结果对于预测下一个token有利(不调用API和调用API,损失之差大于于一个阈值,则认为有利),那么就保留这条数据

4. Model Finetuning:   利用上述步骤构造出一个新的数据集,使用这个数据集(含API调用的文本),去做模型微调,让模型学会何时去生成API调用

5. Inference:解码步骤的时候,模型预测出API调用时,先去执行API,把API的结果拼接到文本中,然后继续解码。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值