什么是微调？什么是模型迁移？

最新推荐文章于 2024-01-28 14:33:34 发布

CUHK-SZ-relu

最新推荐文章于 2024-01-28 14:33:34 发布

阅读量2.7k

点赞数 1

文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43210957/article/details/118186360

版权

1.什么是微调？

这个东西其实和模型迁移是相互连接在一起的，就是你将本身类似的一个东西拿到这里拿过来，在这里再稍微训练一下接着使用了，这里稍微再训练一下就是微调了。

2.为什么微调是有效的？

2.1浅层的网络更适合共用

这里我们注意这样的一个问题，在一个模型当中，我们实际上大约可以从浅到深笼统的将其分成大约三个部分：1.特征提取（1.1浅层提取细节上的信息1.2深层上提取总体的信息）2.结果输出。
这里我们可以看出来浅层网络其实在类似的学习模型中，是比较类似的，所以浅层网络是比较可以共用的。

2.2训练时，不同层之间的训练率差异

我们可以因为梯度会越乘算越小，所以我们在计算的过程中会有梯度消失的现象，虽然我们可以使用ResNet来进行优化，但是实际上浅层网络（在forward的过程中他是浅层，但是在backward的过程中就会变成深层）训练起来会比较慢。

2.3综合起来

本身我们就是想改变深层网络的参数情况，保留浅层网络的参数，训练的特性正好帮我们完成了这件事，所以，非常好。

3.怎么实现

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
什么是微调？什么是模型迁移？

1.什么是微调？这个东西其实和模型迁移是相互连接在一起的，就是你将本身类似的一个东西拿到这里拿过来，在这里再稍微训练一下接着使用了，这里稍微再训练一下就是微调了。2.为什么微调是有效的？2.1浅层的网络更适合共用这里我们注意这样的一个问题，在一个模型当中，我们实际上大约可以从浅到深笼统的将其分成大约三个部分：1.特征提取（1.1浅层提取细节上的信息1.2深层上提取总体的信息）2.结果输出。这里我们可以看出来浅层网络其实在类似的学习模型中，是比较类似的，所以浅层网络是比较可以共用的。2.2训练时，
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

CUHK-SZ-relu 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。