寻求开源的实现/迁移学习

最新推荐文章于 2024-10-01 20:22:14 发布

JenoJisung

最新推荐文章于 2024-10-01 20:22:14 发布

阅读量48

点赞数

文章标签： cnn 深度学习神经网络笔记

本文链接：https://blog.csdn.net/zzyzxt/article/details/130578126

版权

文章讨论了如何在小规模和大规模训练集上利用预训练的深度学习模型进行迁移学习。对于小训练集，建议冻结早期层，只训练自定义softmax层。对于大训练集，随着数据量增加，可以冻结更少的层，甚至对整个网络进行微调。预计算激活结果可以加速训练过程。迁移学习的核心是在不同数据集上调整预训练模型的层，以适应新的分类任务。

摘要由CSDN通过智能技术生成

开源不但要下载源码还要下载相应权重。

小训练集：

思路：可以在有1000类物体的ImageNet数据库上训练，因此该网络有一个可以输出千分之一类别概率的softmax神经元。我们能做的就是去掉其softmax层然后创造自己的softmax层来输出Tigger/Misty/其他（识别自己的猫，Tigger Misty为猫名）。

我建议冻结前面这些层，即冻结相应参数（该网络前面所有层的参数），可以只训练与你自己softmax层有关的参数，即与三个类别输出有关的softmax层。
—通过用别人训练好的权重即使在很小的数据库上也可能得到很好的性能

方法：可以把前面某些层设置可训练参数为0。另一种说法是不要训练这些权重，或有时你可以用一个参数例如freeze=1来设置网络。这些不同的方法和不同的深度学习框架可以让你来确定是否训练与某些具体层相关的权重。在这个例子中你可以只训练softmax层的权重同时冻结前面所有层。
另一种应用中比较巧妙的方法是由于前面所有层被冻结了，之前有些固定函数不会变，因为你现在也不改动它也不训练它，因此网络接受输入图像x并把x映射到该层的激活函数上。这个方法可以加速训练，因为我们刚预计算过该层，而该层重激活产生的特征就直接保存在硬盘上。你所做的就是用这个固定函数在该神经网络的前半部分接受任一输入图像X然后计算其特征向量，然后依据这个特征向量训练一个浅层softmax模型去预测。因此预计算之前层的激活结果是有利于你计算的，操作（预计算）训练集所有样本（激活结果）并存到硬盘上，然后训练右边的softmax类别。

预计算的好处是你不需要在训练集上每次迭代都重新计算这些激活结果。所以如果你的训练集比较小，以上就是你可以做的工作。