【入门级大模型微调技术总结】懂深度学习的都能看懂

最新推荐文章于 2024-06-26 13:36:51 发布

Willow输入中

最新推荐文章于 2024-06-26 13:36:51 发布

阅读量270

点赞数 1

文章标签：人工智能语言模型深度学习自然语言处理

原文链接：https://www.bilibili.com/video/BV1je411z7vg/?spm_id_from=333.999.0.0&vd_source=0372a434b10be7c1cd76a831c4ecb815

版权

内容源于b站梗直哥丶:动画科普大模型微调技术总结，推荐看原视频讲的超级好，适合科普或入门（笔记仅供个人学习使用，已经原作同意）

大模型微调发展历史：一阶段主要是改模型结构增加一些参数；二阶段模板设计分软硬两种；三阶段范式相对更统一。

在这里插入图片描述

（1）Adapter微调：增加Adapter很少的额外参数，黄色部分

Adapter Tuning

（2）LoRA：低秩适配（low-rank adaptation），增加旁路，一个编码器一个解码器来模拟内在低秩矩阵，只通过训练新加部分（右侧的A和B）参数来适配下游任务，类似残差

LoRA

（3）Prefix-tuninig：前缀微调不改变模型结构，从训练数据入手，在训练数据前人为添加前缀，相当于任务说明书

Prefix-tuninig

（4）Prompt-tuning：前缀微调的简化版，输入层不额外处理，直接把prompt tokens添加到输入，大写ABC是不同的任务类型（比如情感分析、机器翻译等等），小写abc是句子数据

Prompt-tuning

（5）P-tuning：引入提示词编码器，h0-hi是提示词编码器生成的

P-tuning

总结：各种微调技术的本质——微调隐空间中的h

在这里插入图片描述

Willow输入中

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
【入门级大模型微调技术总结】懂深度学习的都能看懂

入门级大模型微调技术总结
复制链接

扫一扫

Willow输入中

博客等级

码龄5年

24
原创

216
点赞

212
收藏

151
粉丝

关注

私信

热门文章

分类专栏

深度学习论文 8篇

最新评论

【MiniCPM-V】win10本地部署踩坑
泰兰德爱媳妇: 大佬，能出个WIN10的部署教程吗
【自监督通用方法】Barlow Twins | 通过减少冗余进行的自监督学习
CSDN-Ada助手: 恭喜您撰写的第13篇博客！标题中提到的自监督学习通过减少冗余来实现，令人着实引起了我的兴趣。您对这个主题的深入研究和分享无疑为读者们提供了宝贵的知识。希望您能继续保持这份创作的热情和坚持，为我们带来更多有关自监督学习的精彩内容。在下一个创作中，我建议您可以考虑探索一下自监督学习在实际应用中的潜力和局限性。或者，您还可以分享一些关于如何优化自监督学习算法以提高效率的实用技巧。不过，无论您选择哪个方向，我相信您的深入研究和清晰表达一定会为我们呈现出一篇又一篇的精彩博文。期待着您未来更多的创作！
【Transformer改进】解决Transformer复杂度较大问题的变体模型Star Transformer
CSDN-Ada助手: 恭喜您发布了第14篇博客！对于解决Transformer复杂度较大问题的变体模型Star Transformer的分享，我感到非常兴奋。您对于这一领域的深入研究和分享让我受益匪浅。希望您能够继续保持创作的热情，分享更多关于Transformer模型的新颖观点和研究成果。或许在下一篇博客中，您可以探讨一下Star Transformer模型在实际应用中的性能表现，或者与其他相关模型的对比分析，这样可以为读者提供更全面的参考和启发。期待您的下一篇精彩内容！
【入门级大模型微调技术总结】懂深度学习的都能看懂
CSDN-Ada助手: 恭喜博主完成第10篇博客！标题看起来非常吸引人，我相信这篇文章一定会让懂深度学习的人都能轻松理解。你对入门级大模型微调技术的总结一定会为读者提供宝贵的经验和指导。接下来，我希望你能继续深入探索深度学习领域，为我们带来更多精彩的内容。或许你可以考虑分享一些高级的模型微调技术或者与其他领域的交叉应用，这将让我们受益匪浅。期待你的下一篇博客！
【时序数据 - 自监督预训练】基于时频一致性的时间序列自监督对比预训练
CSDN-Ada助手: 恭喜您撰写了第11篇博客！标题“【文献分享】基于时频一致性的时间序列自监督对比预训练”听起来非常引人注目。您的博客内容一直都很有深度和见解，我非常期待阅读您的最新一篇文章。在下一步的创作中，我建议您可以尝试探索一些实际案例或者应用场景，将这个时频一致性的预训练方法应用到实际问题中。这样可以更好地展示这个方法的实用性，并为读者提供一些实际操作的指导。同时，如果您能加入一些具体的示例、实验结果或者可视化展示，将会更加生动和容易理解。继续保持您的博客创作热情和才华，我期待着您的下一篇文章！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。