多尺度滑动窗口 muti-scale

最新推荐文章于 2024-07-24 11:38:09 发布

冯偲

最新推荐文章于 2024-07-24 11:38:09 发布

阅读量1w

点赞数

分类专栏：行人检测文章标签：多尺度滑动窗口图像金字塔感兴趣区域提取行人检测目标检测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fclovw/article/details/52421598

版权

在行人检测中总是需要将一张大的图像切分成和训练样本一样大小的图像，包括其他的识别和检测任务一样，也需要这一步。刚开始研究阶段不是很明白如何在一张大的图像中精准的找到行人检测的那个识别框。后来才清楚其中道理，比如opencv中自带的行人检测模块，就是使用多尺度滑动窗口来提取n个检测窗口，并记录窗口的坐标，最后再将这些检测的子窗口送入分类器。

多尺度滑动窗口（以行人检测为例）主要包括两个部分一个是滑动窗口来提取大小为128*64窗口大小的图像，然后再对大图进行缩放，在进行滑动窗口，具体的算法如下

1.首先输入一张待检测的图像I,然后用设在scale=x(x>1),在scale尺度下通过滑动提取的子窗口集合为Y=【img1、img2、、、】

2.利用滑动窗口法在图像I上提取子图像，这是有两部分参数需要设置，首先是窗口的大小比如128*64，再者是滑动的步长，比如每次滑动为K个像素，子窗口Yi=【img1、img2、、、】。

3.对图像I进行缩放I=I*(1/scale)返回步骤二执行

4,

最低0.47元/天解锁文章

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。