关于DPMv5(Deformable Part Model)算法中Model结构的解释

论文描述Model

关于可变部件模型的描述在作者[2010 PAMI]Object Detection with Discriminatively Trained Part Based Models的论文中已经有说明:(这部分来自masikkk的翻译Object Detection with Discriminatively Trained Part Based Models [PAMI 2010]中文翻译有关可变形部件模型(Deformable Part Model)的一些说明
含有n个部件的目标模型可以形式上定义为一个(n+2)元组:(F0,P1,…, Pn, b),F0是根滤波器,Pi是第i个部件的模型,b是表示偏差的实数值。每个部件模型用一个三元组定义:(Fi,vi, di),Fi是第i个部件的滤波器;vi是一个二维向量,指定第i个滤波器的锚点位置(anchor position,即未发生形变时的标准位置) 相对于根的坐标;di是一个四维向量,指定了一个二次函数的参数,此二次函数表示部件的每个可能位置相对于锚点位置的变形花费(deformation cost)。

v5 VS v3

由于我一直在看的是v5部分的代码,而masikkk的博客主要分析的是v3的全部,虽然v5版本很复杂,但是还得硬着头皮看不是~
v3模型
上图:v3-person模型
v5模型
上图:v5-car模型

v5中的初始化是存放在model文件夹下的model_creat.m文件
简要的字段说明如下表:

字段名维度说明
classcar类名
year2010Pascal数据集的年份
note字符串表示对此数据集的说明
filters数组1*numfilters的结构体(一个结构体是四元组(blocklabel,size(2*1),flip,symbol))终端滤波器
rules数组1*numsymbols的单元规则
symbols数组1*numsymbols的结构体语法样本表??
numfiltersint滤波器的长度
numblocksint块的长度
numsymbolsint符号集的长度
start数组语法开始的符号(代码中显示是数组,但是打开model却是int)
maxsize数组2*1检测窗口的最大高宽比
minsize数组2*1检测窗口的最小高宽比
intervalintHOG特征金字塔的层数
sbinintHOG特征的单元宽度
threshint判断正负样本的阈值
type字符模型的类型,默认为星型,还可以是语法型
blocks数组1*numblocks的结构体保存块数据的结构体
features数组1*1的结构体存储图像的基本特征(sbin,dim,truncation_dim,extra_octave,bias)
stats结构体1个4*2的结构体存储的是模型训练过程中的耗时和状态
bboxpred单元cell6*1的单元是对检测结果所要标注的框的位置x1,y1,x2,y2

待续

还没有看完,比如block,symbols,grammar的含义,都待续

参考文章

1、关于DPM(Deformable Part Model)算法中模型结构的解释

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

yomo127

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值