多尺度滑动窗口 muti-scale

在行人检测中总是需要将一张大的图像切分成和训练样本一样大小的图像,包括其他的识别和检测任务一样,也需要这一步。刚开始研究阶段不是很明白如何在一张大的图像中精准的找到行人检测的那个识别框。后来才清楚其中道理,比如opencv中自带的行人检测模块,就是使用多尺度滑动窗口来提取n个检测窗口,并记录窗口的坐标,最后再将这些检测的子窗口送入分类器。

多尺度滑动窗口(以行人检测为例)主要包括两个部分一个是滑动窗口来提取大小为128*64窗口大小的图像,然后再对大图进行缩放,在进行滑动窗口,具体的算法如下

1.首先输入一张待检测的图像I,然后用设在scale=x(x>1),在scale尺度下通过滑动提取的子窗口集合为Y=【img1、img2、、、】

2.利用滑动窗口法在图像I上提取子图像,这是有两部分参数需要设置,首先是窗口的大小比如128*64,再者是滑动的步 长,比如每次滑动为K个像素,子窗口Yi=【img1、img2、、、】。

3.对图像I进行缩放I=I*(1/scale)返回步骤二执行

4,

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值