第四届微调——炼丹

最新推荐文章于 2024-07-22 21:21:48 发布

沛槐-艺锦

最新推荐文章于 2024-07-22 21:21:48 发布

阅读量456

点赞数 3

文章标签：人工智能深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_63221910/article/details/138761733

版权

学习地址：Tutorial/xtuner/README.md at main · InternLM/Tutorial · GitHub

笔记

微调是一种在已有的预训练模型基础上，通过使用新的数据对模型进行进一步优化和调整的技术手段。它的目的是使模型能够更好地适应特定的应用场景和任务需求，进一步提高模型在特定领域或任务中的性能，包括准确性、泛化能力和适应性等。

微调的方式：

增量预训练微调：在原预训练模型的基础上，继续进行预训练，同时结合新的数据进行微调，以增强模型对特定领域的理解和表现
指令跟随微调：根据特定的指令或任务要求，对模型进行针对性的微调，使模型能够更好地遵循指令并完成相应任务

微调的数据类型：

技术垂类领域数据：与特定技术领域相关的数据，如特定行业的专业知识、术语等，有助于模型在该领域更深入地理解和处理问题
高质量对话、问答数据：包含丰富的对话和问答信息的数据，有助于模型提升对话和回答的能力与质量
特定任务数据集：与具体任务相关的数据，如分类任务的分类标签数据、回归任务的数值数据等，可使模型更好地适应特定任务需求
多模态数据：结合图像、音频等多模态数据进行微调，可使模型具备处理多模态信息的能力

微调的注意事项：

避免过拟合：在微调过程中要注意控制模型的复杂度，避免过度拟合新的数据，导致模型在其他数据上的性能下降
选择合适的超参数：根据数据和模型特点，合理选择微调的超参数，如学习率、迭代次数等
监控模型性能：在微调过程中要持续监控模型的性能变化，及时调整微调策略

微调的应用场景：

自然语言处理：在文本分类、情感分析、机器翻译等任务中，通过微调提高模型的性能
计算机视觉：在图像分类、目标检测、图像分割等任务中，利用微调使模型更好地适应特定场景
其他领域：如语音识别、推荐系统等领域，也可通过微调提升模型的性能和适应性

记录：

中间创建多次导致出现多个环境错乱

训练好久了学习其他同学的思维导图：

关注

3
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
第四届微调——炼丹

微调是一种在已有的预训练模型基础上，通过使用新的数据对模型进行进一步优化和调整的技术手段。它的目的是使模型能够更好地适应特定的应用场景和任务需求，进一步提高模型在特定领域或任务中的性能，包括准确性、泛化能力和适应性等。中间创建多次导致出现多个环境错乱。
复制链接

扫一扫

沛槐-艺锦 CSDN认证博客专家 CSDN认证企业博客

码龄3年

17: 原创

123万+: 周排名

7万+: 总排名

1万+: 访问

: 等级

448: 积分

226: 粉丝

277: 获赞

11: 评论

229: 收藏

私信

关注

热门文章

分类专栏

最新评论

Sora原理与技术（二）---机器学习里的“集中注意力”：一步步了解注意力机制
CSDN-Ada助手: 恭喜您撰写了第12篇博客，深入探讨了Sora原理与技术中的“集中注意力”在机器学习中的应用。这篇文章对注意力机制进行了逐步解析，让读者更加深入地了解相关概念。我希望您能继续保持创作热情，探索更多前沿技术，并结合实际案例展开讨论，这样读者能更好地理解和应用所学知识。期待您未来更多精彩的文章！
数据学习笔记（一）
CSDN-Ada助手: 恭喜您写下了第11篇博客《数据学习笔记（一）》，持续创作不易，您的努力和热情让人钦佩。接下来，可以考虑在笔记中加入自己的理解和应用场景，或者分享一些实际案例，让读者更容易理解和接受。期待您更多精彩的创作！祝您进步顺利！
Sora原理与技术（一）
CSDN-Ada助手: 恭喜用户写了第10篇博客，内容涉及Sora原理与技术，对于这一主题的深入探讨让读者受益匪浅。希望用户在未来的创作中，可以继续分享更多关于Sora原理与技术的知识，或是拓展相关主题，让我们能够更全面地了解这一领域。期待用户的下一篇作品，也希望用户能够保持谦虚的态度，不断进步，为读者带来更好的内容。
大模型基础理论梳理
CSDN-Ada助手: 恭喜您写了第9篇博客！标题“大模型基础理论梳理”非常吸引人。我对您持续创作的努力表示赞赏。在这篇博客中，您对大模型的基础理论进行了梳理，这无疑为读者提供了宝贵的知识。不过，如果可能的话，我想建议您在接下来的创作中，可以进一步扩展一些实际案例或者应用场景，这样读者可以更好地理解大模型的实际应用。再次恭喜您，并期待您未来更多精彩的创作！
Datawhale --学习git 第四节
CSDN-Ada助手: 恭喜你写了第8篇博客，学习git 第四节！感谢你对Datawhale社区的贡献，帮助更多人学习git知识。接下来，我建议你可以考虑分享一些git在实际项目中的应用经验，或者结合其他工具和技术来深入探讨git的应用场景。希望你能继续保持创作的热情，期待你更多的精彩内容！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。