finetune踩坑

最新推荐文章于 2023-01-31 18:28:11 发布

9573号搬运工

最新推荐文章于 2023-01-31 18:28:11 发布

阅读量841

点赞数

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45154016/article/details/103042386

版权

深度学习专栏收录该内容

9 篇文章 0 订阅

订阅专栏

最近在学习深度学习网络，在MobileNetv3+YUNYANG1994大神的yolov3
使用自己的数据集从零训练没有任何问题。
但是使用Google官方给出基于imagenet训练的预训练模型finetune的时候，trainloss总是维持在18.5降不下去。
几次尝试和摸索，总结几点（问题不分先后）：
1.finetune分为两种，（一）局部微调，（二）全局微调，局部微调的时候，需要注意，在用优化器优化的时候，哪些参数是不变，哪些参数是变得。
2.各个部分的参数名字要与函数中的一一对应。
3.预训练模型中有的参数的值直接继承过来就好，预训练模型中没有的参数，要根据yolo模型中各层原本的初始化参数进行初始化，比如yolo中的weight是‘glorot_uniform’，bias是‘zeros’，beta和moving_mean是‘zeros’,gamma和moving_variance是‘Ones’，将带有ExponentialMovingAverage的都初始化为相反的等等。

问题3的发现是将trainloss=18.5的模型解析，ckpt文件中，yolo模型部分参数都是0或无限接近0的数（因为在初始化的时候，将所有的都统一初始化为0或random_uniform了）

9573号搬运工

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
finetune踩坑

最近在学习深度学习网络，在MobileNetv3+YUNYANG1994大神的yolov3使用自己的数据集从零训练没有任何问题。但是使用Google官方给出基于imagenet训练的预训练模型finetune的时候，trainloss总是维持在18.5降不下去。几次尝试和摸索，总结几点（问题不分先后）：1.finetune分为两种，（一）局部微调，（二）全局微调，局部微调的时候，需要注意，...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。