HOG基本思想及瞎想

最新推荐文章于 2024-05-16 13:32:57 发布

csdn_kike

最新推荐文章于 2024-05-16 13:32:57 发布

阅读量418

点赞数

分类专栏：图像处理模式识别人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/csdn_kike/article/details/79572080

版权

图像处理同时被 3 个专栏收录

4 篇文章 0 订阅

订阅专栏

4 篇文章 0 订阅

订阅专栏

4 篇文章 0 订阅

订阅专栏

HOG（histogram of oriented gradient）是成名的特征描述方法，在检查行人的应用上收到很好的效果，所以学习一下。

图像的特征提取的一个基本前奏就是，先给分块，然后对每个分块进行处理。典型的hog的做法是将图像分成8*8像素的 cell，针对每个cell进行特征提取处理。首先是针对每个像素的x，y方向的梯度计算，也可说是一维卷积吧，x方向模板[-1 0 1]，y方向模板为[1 0 -1]'，转置一下表明是竖方向的算子。梯度计算的算式就是：

Gx = f（x+1 ， y）- f(x-1, y); Gy = f(x, y+1) - f(x, y-1).

然后计算当前点的梯度幅值和方向： Gxy = sqrt(Gx^2 +G y^2); α = arctan(Gy/Gx);

角度α可以是180度以内也可以是360度以内的。

对于cell中每个像素，计算Gxy，和α。

接下来是对cell的直方图进行统计，一般将平面分成9个区间，按照角度，每个区间范围是2π/9。由于某个像素的梯度方向α可能不是2π/9的整数倍，需要进行线性插值操做出分解(一般叫投票)，将对应的Gxy分到邻近的两个分量上去。对于2kπ/9方向（k=0---8），cell中所有像素对应的Gxy加到一起，形成一个2kπ/9方向的分量，从而一个cell形成了9个梯度方向直方图描述符。

剩下的就是一个图所有cell的hog串联形成一个整体描述符，就可以进行接下来的svm分类训练和识别了。

下面要说的，是我的瞎想啦^_^。

我们已经知道有各种各样的卷积模板，来进行不同方向的特征提取，那么如果针对一个cell，设计出9作用方向不同的卷积核，分别对图像进行处理，然后对每个卷积后的图像做某种特征计算，会得到什么鬼。。。HOG的作者做出了相当多的试验，最终证明HOG特征是最合适的行人检测的特征描述符，咱的瞎想。。今天天气，，，哈哈哈。。。好嘛，反正我是有不成熟的想法和疑问啦。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

csdn_kike CSDN认证博客专家 CSDN认证企业博客

码龄8年

28: 原创

53万+: 周排名

192万+: 总排名

8万+: 访问

: 等级

943: 积分

32: 粉丝

54: 获赞

41: 评论

139: 收藏

私信

关注

热门文章

分类专栏

最新评论

GD32F350奇怪的uart溢出中断
谁谓河广一苇杭之: 我也遇到了这个问题，但是加了clear之后发送中断部分还是有异常
实时零相位滤波的神话（1）
exat500g: 要得到完美的零相位不可能，但是可以通过速度补偿得到稍微有些变形的零相位，在匀速状态下可以使用的
GD32F350奇怪的uart溢出中断
余生皆假期-: 遇到相同的问题已解决谢谢
SPI rx dma的设置
csdn_kike: 这个文里有说要发送dummy 才有机会收，你有先发东西过去吗？另外可以试试不用dma，直接写数据过去看有没有收。另外，你这么说可能是对方的spi没有设置为主或者对方没有给出时钟信号，导致你动不了？
SPI rx dma的设置
interwed: 博主，我甚至spi从模式但一直卡在dma receive的地方，这种一般会是什么原因;设置master是没问题的

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。