MDNET工程阅读笔记

本文详细介绍了MDNET的网络结构,包括输入、网络层及输出。在训练部分,探讨了mdnet_prepare_model和mdnet_pretrain的流程,涉及VGG模型的迁移学习、数据集处理和网络训练策略。在跟踪部分,讲解了genConfig和mdnet_run的使用,重点阐述了在线跟踪过程中样本生成、特征提取和目标位置预测的步骤。
摘要由CSDN通过智能技术生成

网络结构

  • 输入:107×107大小的RGB目标图片              
  • 网络层:包括三个卷积模块(conv1,conv2,conv3)和三个全连接模块(fc4,fc5,fc6)。其中,fc6在训练时具有K个分支,每个K分支包含一个具有softmax交叉熵损失的二分类层,  它负责区分每个域(训练视频)中的目标和背景。
  • 在跟踪时,fc6会被替换成单个分支,以用于新的测试序列。
  • 输出:一个分数,用来区分目标和背景,得分越高,是目标的概率越大。

 

 

训练部分

一、mdnet_prepare_model

1. 读取VGG的conv1、2、3,得到layers。layer中有11个结构体,分别是conv1,relu1,norm1,pool1;conv2,relu2,norm2,pool2;conv3,relu3,conv4;

2. 遍历layers,为不同种类的层添加属性和值,去掉conv4。

3. 自定义了fc4模块(包含fc4,relu4,dropout4)、fc5模块(包含fc5,relu5,dropout5),fc6模块(包含fc6,softmax)。

 

二、mdnet_pretrain

在VOT2013,2014,2015上训练,用OTB微调

1.设置要训练的序列集

 

2.初始化:

网络结构模型mdnet_init.mat;

输出的训练结果模型mdnet_vot-otb_new.mat;

ROI(采样)数据库roidb.mat;

 

3.初始化重要参数:

      opts.train.batch_frames= 8;%每个batch(视频序列?)随机选8帧;

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值