【笔记】动手学深度学习 - 微调（迁移学习）

最新推荐文章于 2024-02-29 13:42:06 发布

echo_gou

最新推荐文章于 2024-02-29 13:42:06 发布

阅读量533

点赞数

分类专栏： # 动手学深度学习文章标签：深度学习迁移学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/echo_gou/article/details/121357561

版权

动手学深度学习专栏收录该内容

17 篇文章 42 订阅

订阅专栏

视频网址：37 微调【动手学深度学习v2】_哔哩哔哩_bilibili

什么是微调？

一般来说自己的数据集并不会和ImageNet上面的数据集这么大，而我们训练模型的时候又希望数据集越大越好，所以这个时候我们就使用ImageNet等庞大的数据集对自己的网络进行一个预训练，让自己网络在使用自己数据集训练的时候有一个比较好的大方向正确。

先在源数据集上训练之后，放到自己数据集上跑时，让模型初始化不再是随机，而是复制之前的在源数据集上得到的模型数据，只有最后做分类的全连接层是随机的：

这样初始化的时候就已经和最终想要的模型很像了。

因为模型已经处于比较好的状态了，所以：

使用更小的学习率

使用更少的数据迭代

越是层数浅，所学习的东西越是笼统，学习的更加语义化，而更深之后可能才是去真正识别的功能。即层数越深，越和你的分类的标号越相关，层数越浅，越是底层。所以浅层的训练更加的通用，高层的参数不同的数据集差别越大。

作用：

所以可以把底层的权重更新固定住不优化，这样模型复杂度更低，就会快很多，是一个更强的正则的效果。或者你的数据集很小的情况下，你可以固定住浅层，这样大方向就不会错，就不会导致过拟合了。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

echo_gou CSDN认证博客专家 CSDN认证企业博客

码龄8年

112: 原创

12万+: 周排名

63万+: 总排名

14万+: 访问

: 等级

1273: 积分

1417: 粉丝

156: 获赞

35: 评论

576: 收藏

私信

关注

热门文章

分类专栏

数学 7篇
机器人
ROS 12篇
slam 9篇
Linux 8篇
cmake 3篇
论文
深度学习
动手学深度学习 17篇
吴恩达深度学习 1篇
OpenCV 2篇
pytorch学习文档 12篇
python知识 16篇
报错 2篇
人工智能 1篇
操作系统 1篇
C++ 7篇
算法 7篇

最新评论

ubuntu18.04的PCL安装和配置
快乐的Frank: 为什么我按照操作来，会出现红色方块，而不是这个图形
Ubuntu使用ssh连接两个主机
高原葫芦: 两台主机都需要有ssh吗，我目标电脑虚拟机里下了ssh，本机电脑上面都没下可以吗
torch.optim.SGD()
misakaharuhi: 自己写sgd函数，或者在传入前记录一次参数值，传入后再跟之前的减，差值就是梯度了
【笔记】动手学深度学习 - 锚框
ManyoDream: 帮了大忙，上课老师都不讲这个r是什么定义
ubuntu18.04安装运行A-LOAM
echo_gou: 首先topic要一致，然后雷达的数据也要转成代码中想要的数据，比如说legoloam接收的激光雷达数据是velodyne格式的，我的雷达是rslidar的，中间应该就需要转一下。应该是这样的。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。