【OpenMMLab打卡Day2】基础视觉模型

最新推荐文章于 2024-04-26 16:51:33 发布

池塘怪谈

最新推荐文章于 2024-04-26 16:51:33 发布

阅读量221

点赞数

文章标签：深度学习计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44125656/article/details/128864768

版权

轻量化模型设计

1x1卷积

在这里插入图片描述
ResNet的BottleNeck block，先使用1x1卷积降低通道数（256->64），再使用3x3卷积，以此来减少计算开销。

可分离卷积

在这里插入图片描述
将常规卷积分解为逐层卷积和逐点卷积两个步骤，可以降低参数量和计算量。先用通道数为1的卷积对每一个通道分开进行卷积，得到N通道互不关联的feature map，相当于对一本书的每一页做单独的卷积；之后再使用1x1的N通道卷积，进行逐点卷积，即对一本书的每一页的同一位置同时进行计算，来做通道之间的信息交互。

学习率对训练的影响

在这里插入图片描述
学习率的设置直接影响了模型的收敛速度和最后能达到的精度，从头训练可以使用较大的学习率，而fine-tune可以使用比较小的学习率。当我们想复现某些工作时，有时候无法满足原工作的训练配置，在调整显卡数量和bs的时候，也应当相应对lr做调整。当 batch size 扩大为原来的 𝑘 倍时，学习率也应该对应扩大 𝑘 倍，这样做可以保证平均每个样本带来的梯度下降步长相同。
eg：假设预训练模型使用 lr=0.1，8卡数据并行训练，如果希望用1卡复现实验，lr 应设置为 0.0125。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【OpenMMLab打卡Day2】基础视觉模型

轻量化模型设计：1x1卷积，可分离卷积。学习率设置
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。