指令数据：训练大模型的“隐形助力”

最新推荐文章于 2024-06-23 17:53:32 发布

亲爱的数据

最新推荐文章于 2024-06-23 17:53:32 发布

阅读量954

点赞数 20

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39640818/article/details/134894345

版权

本文介绍了指令数据在训练大模型中的重要作用，它是通过构造有问有答的形式，使模型更直接地理解和执行任务。与预训练数据相比，指令数据更注重正确性和针对性。大模型通过指令数据微调，能更好地遵循人类指令。同时，文章提到了开源指令数据集的多样性和质量评估方法，以及如何通过模型导向的数据选择方法（MoDS）提高数据质量和必要性，以适应不同大模型的需求。

摘要由CSDN通过智能技术生成

作者：谭婧

（一）指令数据，了解一下

先聊一件圈内趣事：

2023年初，大约在1月到2月份前后，

百度公司如流工作卡上有一个任务，

让百度员工打开脑洞，写“问答对”。

一问一答都让员工设计。

如流是百度员工内部通讯，相当于企业微信。

我推测此举很可能是在充实其“指令数据集”。

百度的做法是非常科学的指令数据集构造方法。

指令数据（Instruct data）是一种用于训练大模型的数据类型。

通常以有问有答的形式呈现。

在一问一答中传递信息，非常直观。

这种形式更接近人类的交流方式，

经过训练，能够更直接地引导大模型“行为”。

对比预训练环节的数据多来自于互联网数据爬取，需要经过清洗，抽取等冗长过程，指令数据的构造是另一种难度。

问题以一种人类真实需求来表达，不能瞎编。

答案则是尽量正确，且有针对性的回答，不能乱造。

例如，回答“今天天气怎么样？”时，

不能说“很好”，

而应该说“今天天气晴朗，气温为20℃，风力微弱。”

大语言模型的知识主要是在预训练期间学习的。

大语言模型“炼成后”，仍需“三大”步骤；

在第一个步骤中，通过指令数据进行有监督学习，至关重要。

指令（Instruct）可以简单理解为，

“命令”“指示”“指挥”，就是人类下达指令“让”大模型“干活”：

写封信，写首诗，写代码，等等。

比如，闲聊中也会有问有答的句子，但明显不同于指令数据，指令数据的内容针对问题来回答，所以针对性强。闲聊数据中找问答对，效率太低。

从学术人员的角度，

以前是小模型百花齐放的世界，一个模型干一件事（任务）。

现在是大模型一统天下，一个大模型能干得活可太多了，不能乱指挥，

得有一直方式让它知道你想干啥。

人类写好的一问一答的这种方式，

很适合大模型学习。

指令数据的微调让大模型多遵循指令，

少胡编事实。

指令（Instruct）和提示词（Prompt）的区别？

两者的相同之处在于都可以引导模型。

通常来说，指令更强调对模型的具体要求，让其执行某个特定的任务，

而提示词更广泛，可能是一个问题、一个主题或一个启发性的语境。

大家观察GPT-3.5，喜欢参考Instruct-GPT的论文，看看论文里怎么说：

“我们收集了一个数据集，并使用此数据集做训练，让模型学习和参考，期望大模型的输出像人类已经编写好的例子这样。”

浪潮信息人工智能软件研发总监吴韶华的观点是，模型对于训练数据集学习能力是非常强的，高质量数据成为大模型

最低0.47元/天解锁文章

亲爱的数据

关注

20
点赞
踩
24

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

亲爱的数据 CSDN认证博客专家 CSDN认证企业博客

码龄7年

185: 原创

24万+: 周排名

2万+: 总排名

13万+: 访问

: 等级

1737: 积分

323: 粉丝

371: 获赞

17: 评论

401: 收藏

私信

关注

热门文章

最新评论

云从科技从容大模型：大模型和AI平台什么关系？为什么造行业大模型？
CSDN-Ada助手: 一定要坚持创作更多高质量博客哦, 小小红包, 以资鼓励, 更多创作活动请看: 新星计划2023: https://marketing.csdn.net/p/1738cda78d47b2ebb920916aab7c3584?utm_source=csdn_ai_ada_redpacket 新星计划2023: https://marketing.csdn.net/p/1738cda78d47b2ebb920916aab7c3584?utm_source=csdn_ai_ada_redpacket 上传ChatGPT/计算机论文等资源，瓜分￥5000元现金: https://blog.csdn.net/VIP_Assistant/article/details/130196121?utm_source=csdn_ai_ada_redpacket 新人首创任务挑战赛: https://marketing.csdn.net/p/90a06697f3eae83aabea1e150f5be8a5?utm_source=csdn_ai_ada_redpacket Microsoft Edge功能测评！: https://activity.csdn.net/creatActivity?id=10403?utm_source=csdn_ai_ada_redpacket 职场解惑讨论会: https://activity.csdn.net/creatActivity?id=10427?utm_source=csdn_ai_ada_redpacket 可持续能源技术真的能改变世界吗？: https://activity.csdn.net/creatActivity?id=10425?utm_source=csdn_ai_ada_redpacket 无效数据，你会怎么处理？: https://activity.csdn.net/creatActivity?id=10423?utm_source=csdn_ai_ada_redpacket 物联网技术正在如何影响我们的生活: https://activity.csdn.net/creatActivity?id=10421?utm_source=csdn_ai_ada_redpacket 生物识别技术能否成为应对安全挑战的绝佳选择？: https://activity.csdn.net/creatActivity?id=10411?utm_source=csdn_ai_ada_redpacket 应届生如何提高职场竞争力: https://activity.csdn.net/creatActivity?id=10409?utm_source=csdn_ai_ada_redpacket 讯飞星火大模型将超越chatgpt？: https://activity.csdn.net/creatActivity?id=10407?utm_source=csdn_ai_ada_redpacket 职场新人备忘录: https://activity.csdn.net/creatActivity?id=10405?utm_source=csdn_ai_ada_redpacket “裸奔”时代下该如何保护网络隐私: https://activity.csdn.net/creatActivity?id=10401?utm_source=csdn_ai_ada_redpacket VR vs AR：哪种技术更有潜力改变未来？: https://activity.csdn.net/creatActivity?id=10399?utm_source=csdn_ai_ada_redpacket 蓝桥杯备赛指南分享: https://activity.csdn.net/creatActivity?id=10317?utm_source=csdn_ai_ada_redpacket
独家丨前美团联合创始人王慧文“正在收购”国产AI框架OneFlow，光年之外欲添新大将...
samRsa: 本文作者照片好漂漂
独家丨前美团联合创始人王慧文“正在收购”国产AI框架OneFlow，光年之外欲添新大将...
赵4老师: 本文作者照片好漂漂
清华系创企RealAI：独家“隐私保护机器学习”技术，全球首款编译级产品
普通网友: 收获很多，谢谢大佬的分享，要是能得到大佬的点赞必是极好的
清华系创企RealAI：独家“隐私保护机器学习”技术，全球首款编译级产品
普通网友: 学起来，头秃的那种~

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。