【论文学习笔记】Class-Specific Hough Forests For Object Detection

最新推荐文章于 2020-08-23 20:04:44 发布

cliff_zf

最新推荐文章于 2020-08-23 20:04:44 发布

阅读量2k

点赞数 1

分类专栏：目标检测机器学习决策树文章标签：目标检测决策树机器学习图像处理

机器学习同时被 3 个专栏收录

4 篇文章 0 订阅

订阅专栏

3 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

用于目标检测的特定类别霍夫森林

随机森林：

测试样本送人森林中，接受所有树的检验，对于每个树，该样本抵达的那个叶子作为输出结果的一项记录，所有记录的平均值作为该样本最终的输出。

构造霍夫森林：

训练树的过程中，图像块抵达某个节点的信息被储存下来，具体的，我们储存了抵达该节点的图像块集之中源于目标图片的图块所占的比重Cl以及偏移向量Dl（图块中心和原图中心的位置偏移向量，负样本中的图块的Dl 为0）

图块表观和二值测试：

训练过程中，对于树上的每一个非叶子节点，都要针对图块Ii的表观进行一个二值测试。训练和测试的时候，所有图块都是固定大小，如16*16pixel,图块Ii的表观由提取到的特征通道定义，即Ii={Ii1,Ii2,..IiC},C是通道数。

树的构建：

从根节点递归地构造树——构建过程中，每个节点储存了一个训练图块集，如果该节点深度达到最大深度（Dmax=15）或者节点储存的图块集数量很小（Mmin=20）,则停止递归，令该节点为叶子节点，并且将叶子的投票信息（Cl,Dl）积累并存储起来。

否则，该节点被创建为非叶子，并从一个大的随机生成的二值测试池中选择一个最优的二值测试。根据所选的二值测试，将到达该节点的训练图块集分为2个子集（输出0的为一个子集，输出1的为另外一个子集），分别成为该节点的2个儿子节点。

训练建树的图示步骤：

（b）每个叶子存放了落入该叶子的图块集中目标子区块的比重，以及各目标子区块中心偏移向量数组。

(c)对应上图中各个叶子的图块集中的，部分示意图块图。注意到霍夫森林中的所有叶子构成了一个区别力很强的特定类别分类的编码本：那些落入前三个叶子中的训练样本可以认为是汽车目标的不同部分。

构建霍夫森林的关键在于，二值测试评测的质量如何。

类的比重Cl和偏移向量列表Dl都用于投票。

一个更高级的方法是去选择二值测试方法，使得分类标签和偏移向量的不确定性，沿着树枝不断减少。

如何选择二值测试的函数呢？

1，先均匀的采样a,p,q,r,s,t 生成一个二值测试池t^k

2，假设数据的真实差点值为100，则t（差点值T）取为50-100之间的均匀随机数

3，然后随机的选择优化方式，即该节点可以最小化类别不确定度，也可以最小化偏移不确定度。

4，一旦负样本区块总数少于5%，则节点进行优化的方式为——最小化偏移不确定度。

5，最终选择这样的二值函数t^k——它将所有图块分为2部分后，2个图块子集各自的不确定度总和最小。

减少类别标签不确定度的节点和减少偏移不确定度的节点之间进行交叉来建树，这种树构建的过程保证了所有到达叶子的区块在类别标签和偏移属性上均具有较好的不变性。

结果便是，霍夫森林的叶子们，可以对目标的质心位置进行比较精准的投票。可用于目标位置检测了

使用霍夫森林进行目标检测：

假设在训练和测试的环节中，所有目标边框均为W*H固定尺寸。则只需求出目标中心的位置，即可确定目标整体的位置。

考虑测试图片中的任意图块,

,y是图块的中心。

I(y)是图块表观，c(y)是未知的图块类别（是否属于目标区域的部分，是c（y）=1,否则c(y）=0），d(y)是图块I(y)到测试图片中心的偏移（c（y）=1才有效，否则d=0）。

E（x）表示目标中心位于测试图片的x处这一事件。

感兴趣的是，计算条件概率

，p(E(x)|I(y))表示图块I(y)所带来的目标位置估计——目标中心位于原图中x位置的概率。

分为两种情况：图块中心y在目标边框B(x)内，或是目标边框外。

若y不在B(x)内——I(y)不是目标的子图块，则假设I(y)不贡献任何信息给E(x)。p(E(x)|I(y))=p(E(x)).这里没有考虑到上下文的信息有效性。

我们仅考虑对目标检测有效的图块全部来自于目标区块的子区块。集中考虑y在B(x)之中的情况。

一旦y在目标边框内，则显然有c(y)=1——I(y)是目标的子区块。条件概率为：

将区块I(y)传入霍夫森林的树之中，可以得到（5）中的各个因式的值。假设在树T上，I(y)落入叶子L上，则第一个因式可由核密度估计（Parzen窗）得到，第二个因式即为Cl.

单棵树的情况下，该条件概率为核密度估计乘以CL.——高斯核密度估计。

对于多树森林，我们将各个树的输出取平均值得到森林的输出。

以上2式表示了单个图块对于估计目标位置的贡献，即目标位置以上述概率趋近于x位置。

怎样进行各图块的投票呢？

将所有图块对应的条件概率累积起来，得到一副霍夫图像V（x）——即对每一个像素位置，均得到此处作为目标中心的可能性估计。

找到最大的响应位置，即可认为此处为目标中心。

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
【论文学习笔记】Class-Specific Hough Forests For Object Detection

用于目标检测的特定类别霍夫森林随机森林：测试样本送人森林中，接受所有树的检验，对于每个树，该样本抵达的那个叶子作为输出结果的一项记录，所有记录的平均值作为该样本最终的输出。构造霍夫森林：训练树的过程中，图像块抵达某个节点的信息被储存下来，具体的，我们储存了抵达该节点的图像块集之中源于目标图片的图块所占的比重Cl以及偏移向量Dl（图块中心和原图中心的位置偏
复制链接

扫一扫

专栏目录

cliff_zf CSDN认证博客专家 CSDN认证企业博客

码龄13年

13: 原创

23万+: 周排名

193万+: 总排名

11万+: 访问

: 等级

1292: 积分

120: 粉丝

107: 获赞

58: 评论

236: 收藏

私信

关注

热门文章

分类专栏

最新评论

人脸识别CNN网络训练流程
weixin_40759917: 博主您好，请问您当时训练模型大概用了多少时间？我也在用和您一样的数据集，在pytorch下用GPU训练，训练一代需要2个小时，不知道是否正常。
人脸识别CNN网络训练流程
城俊BLOG: CASIA-WebFace 这个数据集到底是494414张还是493456张？
【论文学习笔记】Class-Specific Hough Forests For Object Detection
费马定理: 博主你好，我也读了这篇文章，有个问题想请教您一下，文章中为什么要使用像素值分割作为分裂准则呢，这个问题想了好久没想明白。
人脸识别CNN网络训练流程
topclear: 我使用您提供的caffemodel进行测试，准确率只有66%，不知道哪里出了问题
人脸识别CNN网络训练流程
topclear: 楼主您好，可以提供一下测试代码吗？挺需要这个的

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。