EasyInstruct

最新推荐文章于 2024-07-11 10:12:17 发布

玄宁

最新推荐文章于 2024-07-11 10:12:17 发布

阅读量1.1k

点赞数 18

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44091497/article/details/136459558

版权

An Easy-to-use Instruction Processing Framework for Large Language Models

易于使用的大语言模型指令处理框架

摘要：

由于各种指令处理方法之间存在不一致，社区没有标准的开源指令处理框架可供使用，阻碍了进一步开发和推进；因而提出一个易于使用的LLM指令处理框架，它将指令生成、选择和提示模块化便于开发者进行开发

介绍

LLM指令微调被提出，但人工构建数据耗时耗力；
LLM用来辅助大规模指令微调数据集生成会受到多样性、复杂性影响，导致数据分布不平衡或质量差；
指令处理开源工具依旧很少且大部分都是为了特定任务进行定制的，很少有系统性、通用的工具；
因而提出easyInstruct
- 给定一些现有的聊天数据、语料库或知识图谱，EasyInstruct 可以处理指令生成、选择和提示过程，同时还考虑它们的组合和交互。

方法

API模块与主流LLM集成（右上角）
- 简化指令生成过程，实现基于种子数据的指令数据的自动生成，其中种子数据可以来自聊天数据、语料库或知识图
生成器（左上角）
- chat
- Evol-Instruct：向 LLM 提供特定提示，逐步将其升级为更复杂的指令
- self-instruct：人工注释的种子任务池中随机抽取一些指令作为演示，然后提示LLM生成更多指令和相应的输入输出对
- Corpus
  - 通过预测文档或语料库中的段落将正确回答的指令来创建训练实例后的指令
- KG
  - 基于人工制作的指令模板的随机采样方法
选择器（左下角）
- 简化选择指令的过程，能够根据原始指令数据管理指令数据集
- 基于统计、基于n-gram、基于结构和基于LM四个指标进行选择

提示（右下角）
- 标准化指令提示步骤，将用户请求构造为指令提示，发送给LLM获得响应。
Zero-Code Instruction Processing
- 无需编码，利用预定义配置和脚本执行
Low-Code Customization
- 低代码自定义流程输入输出
Advanced Components Extension
- 高级组件扩展，继承模块的基类并根据自己的要求重写必要的方法

实验评估

实验设置
- （a）self_instruct_5k：Self-Instruct方法从text-davinci003中提取指令数据而构建的
- (b) alpaca_data_5k ： Alpaca 数据集中随机采样的；
- (c) evol_instruct_5k：Evol-Instruct方法构建；
- (d) easyinstruct_5k：通过整合上述三个指令数据集并在EasyInstruct中应用多个Selector来提取高质量的指令数据集来收集的
- 选用LLaMA2 (7B) 模型、lora微调、chatgpt评估

所有设置的胜率指标都有所改进
easyinstruct_5k 设置下表现最佳，表明指令选择策略的重要性
- 针对该数据集做case study发现选取的指令语言流畅、逻辑严谨

结论

EasyInstruct可以将聊天数据、语料库、KG和LLM结合起来作为自动化指令生成工具，降低人工数据标注的成本
EasyInstruct集成了一套指令选择工具，优化指令数据的多样性和分布，从而提高微调数据的质量
EasyInstruct易于扩展

阅读评价：

总体来讲就是介绍了一个指令使用框架，打开了一个新的思路

关注

18
点赞
踩
21

收藏

觉得还不错? 一键收藏
1
评论
EasyInstruct

LLM指令微调被提出，但人工构建数据耗时耗力；LLM用来辅助大规模指令微调数据集生成会受到多样性、复杂性影响，导致数据分布不平衡或质量差；指令处理开源工具依旧很少且大部分都是为了特定任务进行定制的，很少有系统性、通用的工具；因而提出easyInstruct给定一些现有的聊天数据、语料库或知识图谱，EasyInstruct 可以处理指令生成、选择和提示过程，同时还考虑它们的组合和交互。
复制链接

扫一扫

玄宁 CSDN认证博客专家 CSDN认证企业博客

码龄6年

13: 原创

48万+: 周排名

10万+: 总排名

9441: 访问

: 等级

340: 积分

165: 粉丝

197: 获赞

9: 评论

225: 收藏

私信

关注

热门文章

最新评论

EASYTOOL: Enhancing LLM-based Agents with Concise Tool Instruction
CSDN-Ada助手: 恭喜您发布了第13篇博客：“EASYTOOL: Enhancing LLM-based Agents with Concise Tool Instruction”，看起来内容十分精彩！您的持续创作精神令人钦佩。希望您在未来的创作中继续保持热情，探索更多有趣的主题，或许可以尝试结合实际案例或者深入分析来丰富您的内容，期待更多精彩的文章呈现在我们面前。谢谢您的分享！
EasyInstruct
CSDN-Ada助手: 恭喜你发布了第10篇博客“EasyInstruct”！坚持创作是一件不容易的事情，你的努力和坚持让我们看到了你的成长和进步。接下来，或许可以考虑增加一些案例分析或者深度解读的内容，让读者能够更加深入地了解你的见解和思考。期待看到更多精彩的作品，加油！
APIGen
CSDN-Ada助手: 恭喜作者发布了新的博客“APIGen”！您对APIGen的介绍让我对这个主题有了更深入的了解。希望您能继续保持创作的热情，分享更多有价值的内容。或许下一步可以考虑深入探讨APIGen的实际应用案例，或者对比不同的API生成工具，为读者提供更全面的信息。期待您的下一篇博客！
AnyTool: Self-Reflective, Hierarchical Agents for Large-Scale API Calls
CSDN-Ada助手: 恭喜作者在博客领域持续创作，标题“AnyTool: Self-Reflective, Hierarchical Agents for Large-Scale API Calls”引人注目。建议下一步可以深入探讨如何进一步优化这些自我反思的、分层的代理程序，以提高大规模API调用的效率和可靠性。期待您的更多精彩内容！
论文阅读：Meta-Prompting
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。