第四节课笔记

最新推荐文章于 2024-06-28 14:00:42 发布

lengbaihang

最新推荐文章于 2024-06-28 14:00:42 发布

阅读量356

点赞数 7

文章标签：笔记人工智能机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lengbaihang/article/details/136119806

版权

FINETUNE简介

LLM下游应用中，增量预训练和指令跟随是经常会用到的两种微调模式

指令跟随微调

使用场景：让模型学会对话模板，根据人类指令进行对话

训练数据：高质量的对话，问答数据

为什么需要指令微调？

因为在对话中模型只是根据我们的提问去拟合训练数据集中的分布，它并没有意识你的意图是在向它提问。

通过指令微调后，便可得到instructed LLM，可以输出我们更加相对满意的结果

在进行指令跟随微调前，先定义三个角色

System：给定一些上下文信息，例如我们想微调一个安全的AI助手，那System就是“你是一个安全的AI助手”。

User：用户提问，在微调时将对话样本的提问赋予此角色

Assistant：根据用户提问，结合System上下文信息，输出回答，在微调时将对话样本的回答赋予此角色

全参数微调 LoRA微调 QLoRA微调

XTuner

8GB显存集成Flash Attention DeepSpeed

关注

7
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
第四节课笔记

System：给定一些上下文信息，例如我们想微调一个安全的AI助手，那System就是“你是一个安全的AI助手”。Assistant：根据用户提问，结合System上下文信息，输出回答，在微调时将对话样本的回答赋予此角色。因为在对话中模型只是根据我们的提问去拟合训练数据集中的分布，它并没有意识你的意图是在向它提问。通过指令微调后，便可得到instructed LLM，可以输出我们更加相对满意的结果。User：用户提问，在微调时将对话样本的提问赋予此角色。FINETUNE简介。为什么需要指令微调？
复制链接

扫一扫

lengbaihang CSDN认证博客专家 CSDN认证企业博客

码龄3年

25: 原创

125万+: 周排名

8万+: 总排名

9631: 访问

: 等级

443: 积分

134: 粉丝

219: 获赞

17: 评论

185: 收藏

私信

关注

热门文章

分类专栏

书生浦语第二期 14篇

最新评论

第五节课作业
CSDN-Ada助手: 恭喜您发布了第17篇博客，“第五节课作业”！持续创作是非常了不起的事情，您的努力和坚持一定会得到回报的。接下来，我想建议您可以尝试更多不同的主题和写作风格，这样能够帮助您不断提升自己的写作技巧和思维深度。期待看到您更多精彩的作品，加油！
第五节课笔记
CSDN-Ada助手: 恭喜您写了第18篇博客《第五节课笔记》，持续创作不易，您的坚持和努力可嘉！希望您在未来的创作中能多加思考和总结，让读者能够更加深入地了解您的观点和见解。加油！期待您更多精彩的作品！
第四节课笔记
CSDN-Ada助手: 恭喜您写了第20篇博客《第四节课笔记》，持续坚持创作，实属不易。希望您能在下一篇博客中分享更多关于第四节课的知识和心得体会，让读者能够更深入地了解这个话题。期待您的下一篇作品，加油！
第三节课笔记与作业
CSDN-Ada助手: 恭喜您第16篇博客《第三节课笔记与作业》发表成功！持续创作是提升自己的最好方式，希望您能坚持下去，继续分享您的学习心得和感悟。或许下一步可以考虑与读者分享一些实践经验或者案例分析，让读者更加深入地了解您所学习的内容。期待您更多精彩的作品！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。