SFT和FT的区别

最新推荐文章于 2024-07-01 11:31:28 发布

落落bae

最新推荐文章于 2024-07-01 11:31:28 发布

阅读量1.8k

点赞数 1

文章标签：机器学习人工智能算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44224676/article/details/132066060

版权

supervised fine-tuning 和fine-tuning的区别

当涉及到模型训练的两个术语“supervised fine-tuning”（有监督微调）和“fine-tuning”（微调）时，它们之间的区别主要在于数据集和训练方式。

有监督微调（Supervised Fine-tuning）：

数据集：有监督微调是在一个预训练过的模型基础上进行的。通常，使用一个大型的未标记数据集对模型进行预训练，然后再使用一个标记的、与目标任务相关的数据集对模型进行有监督微调。
训练方式：在有监督微调中，模型以监督学习的方式进行训练。这意味着使用带有标签的输入样本和相应的预期输出来调整模型的参数。目标是通过在具体任务上微调模型的权重和参数来适应特定的任务。

微调（Fine-tuning）：

数据集：微调是指在一个预训练模型的基础上进一步调整模型的权重和参数，使其适应新的任务或领域。与有监督微调相比，微调不限于使用与目标任务直接相关的标记数据集。它可以使用任何可用的数据集来进一步优化模型。
训练方式：微调的训练方式可以根据具体情况有所不同。它可以是有监督的，也可以是半监督的或无监督的。在微调过程中，模型的预训练参数通常会被加载并在新数据集上进行进一步调整。

总结

总的来说，有监督微调是在预训练模型的基础上使用与目标任务直接相关的标记数据进行有监督训练；而微调是在预训练模型的基础上通过进一步调整权重和参数进行优化，适应新的任务或领域，可以使用不同类型的数据集进行训练，并且训练方式可以更加灵活。

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
SFT和FT的区别

总的来说，有监督微调是在预训练模型的基础上使用与目标任务直接相关的标记数据进行有监督训练；而微调是在预训练模型的基础上通过进一步调整权重和参数进行优化，适应新的任务或领域，可以使用不同类型的数据集进行训练，并且训练方式可以更加灵活。
复制链接

扫一扫

落落bae CSDN认证博客专家 CSDN认证企业博客

码龄6年

17: 原创

133万+: 周排名

11万+: 总排名

5800: 访问

: 等级

212: 积分

13: 粉丝

8: 获赞

14: 评论

23: 收藏

私信

关注

热门文章

最新评论

windows开发终极效率terminal+git-bash+zsh+oh-my-zsh
CSDN-Ada助手: 不知道 CS入门技能树是否可以帮到你：https://edu.csdn.net/skill/gml?utm_source=AI_act_gml
搭建miniconda环境，并额外安装自己的包
CSDN-Ada助手: 恭喜您写了第11篇博客！标题看起来非常吸引人，我很期待阅读您关于搭建miniconda环境并额外安装自己的包的内容。您的努力和持续创作的精神值得称赞。在下一步的创作中，我建议您可以探讨一下如何管理和更新您的自定义包，以及如何与其他开发者共享您的工作。期待您未来更多有价值的分享！
tqdm包
CSDN-Ada助手: 恭喜您撰写了第12篇博客！我对您对"tqdm包"的讨论感到非常兴奋。您的文章内容深入浅出，让我对这个包的使用有了更清晰的认识。您对tqdm包的描述非常详尽，使我对其在项目中的实际应用有了更多的了解。在未来的创作中，我希望您能够继续分享您对其他相关工具和技术的见解。比如，您可以探讨如何与tqdm包配合使用其他Python库，或者分享一些您在实践中应用tqdm包时遇到的挑战和解决方案。这样的话，读者将能够更好地理解tqdm包在实际项目中的价值，并且能够更好地应用到自己的工作中去。总之，再次祝贺您的持续创作！期待您以后更多精彩的博客文章！
关于学习率lr
CSDN-Ada助手: 恭喜您撰写了第13篇博客！标题“关于学习率lr”引起了我的兴趣。您对学习率的讨论一定有独到的见解和深入的研究。希望您能继续保持创作的热情和努力，分享更多关于学习率的经验和知识。或许您可以考虑在下一篇博客中探讨学习率与不同优化算法的关系，或是分享一些实际应用中学习率调节的技巧和经验。期待您的下一篇精彩文章！
cudnn_status_not_initialized 最后还是自己代码里的.cuda问题
CSDN-Ada助手: 恭喜您写了第14篇博客！持续创作是一种不断进步的表现，您的努力值得赞赏。针对您提到的".cuda问题"，您的经验分享对于遇到相同问题的读者来说将是非常有帮助的。接下来，我建议您可以继续探索其他常见问题，并结合自己的实践经验，分享更多解决方案和技巧。祝愿您在创作的道路上越走越远！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。