训练自己的数据，微调faster Rcnn模型

最新推荐文章于 2024-06-04 17:14:58 发布

XD_Senior

最新推荐文章于 2024-06-04 17:14:58 发布

阅读量3.2k

点赞数 1

分类专栏：深度学习文章标签： faster rcnn 训练

本文链接：https://blog.csdn.net/XD_Senior/article/details/73999463

版权

深度学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

提供我自己做好的数据：全部资源链接链接: http://pan.baidu.com/s/1o8kGwfo 密码: 需要密码可以留言或者私信。按照上面的文件放置自己的数据，图片等等，然后把整个文件放到faster rcnn->dataset下面，如果没有这个文件夹需要自己建一个。里面有model_zf模型，需要下载下来解压到faster rcnn根目录下，是这个模型的初始参数，我们做的就是微调这个模型。参考博客：http://blog.csdn.net/sinat_30071459/article/details/50546891

1, 标签的修改

VOCopts.classes={...
   '你的标签1'
   '你的标签2'
   '你的标签3'
   '你的标签4'};

将其改为你的标签。

2 、function\fast_rcnn\fast_rcnn_train.m

ip.addParamValue('val_iters',       500,            @isscalar); 
ip.addParamValue('val_interval',    2000,           @isscalar);

可能在randperm(N,k)出现错误，根据数据集修改。（VOC2007中val有2510张图像，train有2501张，作者将val_iters设为500，val_interval设为2000，可以参考作者的设置修改，建议和作者一样val_iters约为val的1/5，val_interval不用修改）

3、function\rpn\proposal_train.m

这里的问题和fast_rcnn_train.m一样。

4, imdb\imdb_eval_voc.m

%do_eval = (str2num(year) <= 2007) | ~strcmp(test_set,'test');
do_eval = 1;

注释掉

do_eval = (str2num(year) <= 2007) | ~strcmp(test_set,'test');

并令其为1，否则测试会出现精度全为0的情况

5. imdb\roidb_from_voc.m

ip.addParamValue('exclude_difficult_samples',       true,   @islogical);

不包括难识别的样本，所以设置为true。(如果有就设置为false)

6.网络模型的修改

（1） models\ fast_rcnn_prototxts\ZF\ train_val.prototxt

input: "bbox_targets"
input_dim: 1  # to be changed on-the-fly to match num ROIs
input_dim: 84 # 根据类别数改，该值为（类别数+1）*4  #################
input_dim: 1
input_dim: 1

input: "bbox_loss_weights"
input_dim: 1  # to be changed on-the-fly to match num ROIs
input_dim: 84 # 根据类别数改，该值为（类别数+1）*4   ############
input_dim: 1
input_dim: 1

layer {
    bottom: "fc7"
    top: "cls_score"
    name: "cls_score"
    param {
        lr_mult: 1.0
    }
    param {
        lr_mult: 2.0
    }
    type: "InnerProduct"
    inner_product_param {
        num_output: 21 #根据类别数改该值为类别数+1   #########

layer {
    bottom: "fc7"
    top: "bbox_pred"
    name: "bbox_pred"
    type: "InnerProduct"
    param {
        lr_mult: 1.0
    }
    param {
        lr_mult: 2.0
    }
    inner_product_param {
        num_output: 84  #根据类别数改，该值为（类别数+1）*4  ##########

（2） models\ fast_rcnn_prototxts\ZF\ test.prototxt

layer {
    bottom: "fc7"
    top: "cls_score"
    name: "cls_score"
    param {
        lr_mult: 1.0
    }
    param {
        lr_mult: 2.0
    }
    type: "InnerProduct"
    inner_product_param {
        num_output: 21  #类别数+1  ##########

layer {
    bottom: "fc7"
    top: "bbox_pred"
    name: "bbox_pred"
    type: "InnerProduct"
    param {
        lr_mult: 1.0
    }
    param {
        lr_mult: 2.0
    }
    inner_product_param {
        num_output: 84  #4*(类别数+1)  ##########

（3） models\ fast_rcnn_prototxts\ZF_fc6\ train_val.prototxt

input: "bbox_targets"
input_dim: 1  # to be changed on-the-fly to match num ROIs
input_dim: 84 # 4*(类别数+1)  ###########
input_dim: 1
input_dim: 1

input: "bbox_loss_weights"
input_dim: 1  # to be changed on-the-fly to match num ROIs
input_dim: 84 # 4*(类别数+1)  ###########
input_dim: 1
input_dim: 1

layer {
    bottom: "fc7"
    top: "cls_score"
    name: "cls_score"
    param {
        lr_mult: 1.0
    }
    param {
        lr_mult: 2.0
    }
    type: "InnerProduct"
    inner_product_param {
        num_output: 21 #类别数+1   ############

layer {
    bottom: "fc7"
    top:"bbox_pred"
    name:"bbox_pred"
    type:"InnerProduct"
    param {
       lr_mult:1.0
    }
    param {
       lr_mult:2.0
    }
    inner_product_param{
       num_output: 84   #4*（类别数+1）   ###########

（4） models\ fast_rcnn_prototxts\ZF_fc6\ test.prototxt

layer {
    bottom: "fc7"
    top: "cls_score"
    name: "cls_score"
    param {
        lr_mult: 1.0
    }
    param {
        lr_mult: 2.0
    }
    type: "InnerProduct"
    inner_product_param {
        num_output: 21  类别数+1 #######

layer {
    bottom: "fc7"
    top: "bbox_pred"
    name: "bbox_pred"
    type: "InnerProduct"
    param {
        lr_mult: 1.0
    }
    param {
        lr_mult: 2.0
    }
    inner_product_param {
        num_output: 84  #4*（类别数+1） ##########

7.solver的修改

solver文件有3个，默认使用的solver是solver_30k40k.prototxt，如下stage 1 rpn，可以在faster_rcnn-master\experiments\+Model\ZF_for_Faster_RCNN_VOC2007.m中更换。

model.stage1_rpn.solver_def_file                = fullfile(pwd, 'models', 'rpn_prototxts', 'ZF', 'solver_30k40k.prototxt');%solver_60k80k.prototxt
model.stage1_rpn.test_net_def_file              = fullfile(pwd, 'models', 'rpn_prototxts', 'ZF', 'test.prototxt');
model.stage1_rpn.init_net_file                  = model.pre_trained_net_file;

！！！为防止与之前的模型搞混,训练前把output文件夹删除（或改个其他名），还要把imdb\cache中的文件删除（如果有的话）

8.开始训练

（1）.下载预训练的ZF模型： fetch_data/fetch_model_ZF.m

（全部资源链接链接: http://pan.baidu.com/s/1o8kGwfo 密码: m7h8 ）

（2）.运行：

experiments/script_faster_rcnn_VOC2007_ZF.m

经过一会的准备工作，就进入迭代了：

如果matlab GUI界面不动，但是命令行报错误，但是已经成功启动GPU了，一般都是各种配置文件没有写对，或者没改过来，具体情况可以网上去查，一般都会有人遇到。

9.训练完后

训练完后，不要急着马上测试，先打开output/faster_rcnn_final/faster_rcnn_VOC2007_ZF文件夹，打开detection_test.prototxt，作如下修改：

将relu5（包括relu5）前的层删除，并将roi_pool5的bottom改为data和rois。并且前面input: "data"下的input_dim:分别改为1,256,50,50(如果是VGG就是1,512,50,50,其他修改基本一样)，具体如下

input: "data"
input_dim: 1
input_dim: 256
input_dim: 50
input_dim: 50

# ------------------------ layer 1 -----------------------------
layer {
    bottom: "data"
    bottom: "rois"
    top: "pool5"
    name: "roi_pool5"
    type: "ROIPooling"
    roi_pooling_param {
        pooled_w: 6
        pooled_h: 6
        spatial_scale: 0.0625  # (1/16)
    }
}

10.测试

训练完成后，打开\experiments\script_faster_rcnn_demo.m，将模型路径改成训练得到的模型路径：

model_dir                   = fullfile(pwd, 'output', 'faster_rcnn_final', 'faster_rcnn_VOC2007_ZF')

将测试图片改成你的图片：

im_names = {'001.jpg', '002.jpg', '003.jpg'};

注意：

如果你的数据集类别比voc2007数据集多，把script_faster_rcnn_demo.m中的showboxes(im, boxes_cell, classes, ‘voc’)作如下修改：

改为：

showboxes(im, boxes_cell, classes);

或者：

showboxes(im, boxes_cell, classes, 'default');

即去掉‘voc’或将其改为‘default’。

如果测试发现出现的框很多，且这些框没有目标，可以将阈值设高一些（默认是0.6）：

thres = 0.9;

结果如下：

这里写图片描述

XD_Senior

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
9
评论
训练自己的数据，微调faster Rcnn模型

提供我自己做好的数据：全部资源链接链接: http://pan.baidu.com/s/1o8kGwfo 密码: 需要密码可以留言或者私信。按照上面的文件放置自己的数据，图片等等，然后把整个文件放到faster rcnn->dataset下面，如果没有这个文件夹需要自己建一个。里面有model_zf模型，需要下载下来解压到faster rcnn根目录下，是这个模型的初始参数，我们做的就是微调这
复制链接

扫一扫

专栏目录