fine-tuning

最新推荐文章于 2024-08-22 10:25:39 发布

听笙

最新推荐文章于 2024-08-22 10:25:39 发布

阅读量3k

点赞数 2

分类专栏： caffe学习笔记 win-caffe

本文链接：https://blog.csdn.net/tomato_ljl/article/details/79170778

版权

caffe学习笔记同时被 2 个专栏收录

19 篇文章 1 订阅

订阅专栏

win-caffe

18 篇文章 0 订阅

订阅专栏

JLU-IPVR

听笙

首先解释一下什么叫fine-tuning，基于一个训练好的caffe模型使用自己的数据，利用训练好的模型的权重参数值，通过修改最后一层的参数和输出类别，训练出一个适合自己数据的模型。

在实际学习的和做工程的过程中我们会遇到一个问题，就是数据量的问题，我们很难采集到大量的数据，因为我们都知道做深度学习需要使用到大量的数据，但是在我们之前已经有很多大牛，神犇为我们做了很多工作，我们需要做的只不过是在他们的基础上加上一点我们自己的数据，就可以得到我们想要的效果了。

准备数据集

还是以mnist为例，已经使用了原始mnist数据训练好了一个模型，使用自己的数据，在这个模型的基础上fine-tuning一个自己的模型，不过这次只做五个数字的识别0-4，训练集4000张，每个数字800张，验证集1000张，每个数字200张。将数据装换为LEVELDB格式，并且生成均值文件。

调整网络参数

使用的lenet网络，首先在输入层data层，修改source和meanfile，根据之前生成的leveldb以及mean.binaryproto最后一层的输出类别，将10改为5，并且修改最后一层的名字。具体修改如下：

可以看到修改了mean_file的路径，source的路径，还有test里batch_size的大小改为20（因为solver里test_iter的大小设置为100，保证这两个数相乘的大小为2000）train里的batch_size的大小依然为100（因为solver里的test_interval的大小设置为80,，保证这两个数相乘大小为8000）。