Self-Instruct

transformer_WSZ

已于 2023-10-13 02:21:43 修改

阅读量127

点赞数

分类专栏： LLM 文章标签： LLM Instruct-tuning

于 2023-10-13 02:20:58 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/transformer_WSZ/article/details/133802311

版权

LLM 专栏收录该内容

21 篇文章 0 订阅

订阅专栏

本篇工作利用LLM的生成能力，来产生大量指令数据集（指令、输入、输出），无需人工标注数据。

flow

其中，在对任务判别的时候，需要区分是输出优先还是输入优先：

输入优先没问题，符合人类直觉，给定指令和输入，然后产生输出
当任务是分类任务的时候，采用输出优先，即先生成一个标签，然后根据标签生成相应的输入文本。这是因为分类任务，如果输入优先，模型倾向于生成正确的文本，比如语法正确的语句，不会产生错误的语句。因此先给出标签“错误”，强制模型根据错误标签生成错误的语句

根据LLM生成的指令来微调LLM，更多是为了提升LLM在零样本任务上的泛化能力：

ret

千万不要误解成了模型自己生成输入和标签，然后自己学习，自娱自乐。

transformer_WSZ

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Self-Instruct

本篇工作利用LLM的生成能力，来产生大量指令数据集（指令、输入、输出），无需人工标注数据。千万不要误解成了模型自己生成输入和标签，然后自己学习，自娱自乐。其中，在对任务判别的时候，需要区分是输出优先还是输入优先。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。