计算机视觉工程师在面试过程中主要考察三个内容:图像处理、机器学习、深度学习。然而,各类资料纷繁复杂,或是简单的知识点罗列,或是有着详细数学推导令人望而生畏的大部头。为了督促自己学习,也为了方便后人,决心将常考必会的知识点以通俗易懂的方式设立专栏进行讲解,努力做到长期更新。此专栏不求甚解,只追求应付一般面试。希望该专栏羽翼渐丰之日,可以为大家免去寻找资料的劳累。每篇介绍一个知识点,没有先后顺序。想了解什么知识点可以私信或者评论,如果重要而且恰巧我也能学会,会尽快更新。最后,每一个知识点我会参考很多资料。考虑到简洁性,就不引用了。如有冒犯之处,联系我进行删除或者补加引用。在此先提前致歉了!
HOG
Histogram of Oriented Gradients
方向梯度直方图
原理
HOG是一种描述图像的特征。顾名思义,主要对像素的梯度方向敏感。
该特征最早用于行人检测,即检测一张图像中是否包含行人。
步骤如下:
- 使用常用图像预处理方法,如去噪,对比度调整等,对图像进行处理。
- 转换为灰度图像。
- 使用常用梯度算子,求取每一个像素点的水平梯度x,竖直梯度y,将两者平方相加开根号求得梯度大小。
- 使用x,y以及反正切函数计算梯度方向,并统一到0到180度的区间。
- 对于每一个像素有了两个参数,梯度大小和梯度方向。
- 将180度分为n个区间,比如9个:0,20,40,60,80,100,120,140,160。
- 如果一个像素的梯度大小为10,梯度方向是60