lbp特征提取算法知乎_目标检测算法有哪些？

最新推荐文章于 2024-04-23 08:28:13 发布

weixin_39522423

最新推荐文章于 2024-04-23 08:28:13 发布

阅读量164

点赞数

文章标签： lbp特征提取算法知乎

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39522423/article/details/111779455

版权

传统方法：级联分类器框架：Haar/LBP/积分HOG/ACF feature+Adaboost

级联分类器最先由Paul Viola and Michael J. Jones在CVPR 2001中提出来。

其实这就是boosting由简单弱分类拼装强分类器的过程，现在看起来很low，但是这个算法第一次使目标检测成为现实！

至于使用的特征，Haar简单也够用了，LBP实在是没必要去扒了。。。

至于HoG/ACF，下面说。

HoG+SVM

Histograms of oriented gradients for human detection，2005，CVPR

由于原始的Haar特征太简单，只适合做刚性物体检测，无法检测行人等非刚性目标，所以又提出了HOG+SVM结构。

之后又有人魔改出LoG/DoG/RoG等一系列特征，没啥意思就不多说了。

值得一提的是，有人把SVM中的HoG改为Integral HoG，用于级联分类器。这也就是目前OpenCV级联分类器的积分HOG的原型：

Integral Histogram: A Fast Way to Extract Histograms in Cartesian Spaces

后续又有人发展出了Aggregate Channel Feature(ACF)等特征，论文主要是下面2个：

Aggregate Channel Features for Multi-view Face Detection，2014，IJCB

Fast Feature Pyramids for Object Detection，2014，PAMI

亮点就是这个Fast，加速了Integral HoG的计算，效果好而且快，依然活跃在嵌入式领域。

Discriminatively trained deformable part models(DPM)

DPM是使用弹簧模型进行目标检测，如下图。即进行了多尺度+多部位检测，底层图像特征抽取采用的是fHoG。反正也是轰动一时了。

后续又有DPM+/DPM++，没啥意思不提也罢。

模版匹配(特殊情况下可以用到，这个不用我介绍了吧？)

CNN方法：基于region proposal(two stage)：R-CNN家族，包括Faster R-CNN/Mask R-CNN/RFCN

然而DPM火了没到2年，R-CNN家族出现了，终于不再用各种魔改版HoG特征搞检测了！

其中R-CNN家族最有代表性的就是Faster R-CNN。Faster R-CNN由RPN网络先产生region proposal，再对region proposals进行classification，就是所谓的two stage。

其实R-CNN系列检测关注他：Kaiming He - FAIR，完全足够了。

基于回归(one-shot)：YOLO/YOLO2/SSD/DSSD

YOLO和SSD都是产生proposal的同时进行classification+regression，一次性完成，即所谓的one-shot。相比two stage速度占优，Precision/Recall略低。

至于YOLO，目前有YOLO v1，YOLO 9000(v2)，YOLO v3

另外我觉得，后续版本DSSD和YOLO v2/v3之间真的没啥差距了，感觉都一样。

这也说明检测已经趋于瓶颈，没有算法突破很难像以前，一下提高几十个点。

特殊的文字序列检测：CTPN(LSTM + R-CNN)／Seglink(SSD魔改)

除了一般意义上的检测，还有一类文字检测，用于OCR前的文字定位。这类检测和一般的检测还有一点点不一样。目前效果比较好的2种：CTPN和Seglink

Faster R-CNN的继承：CTPN水平or竖直文字检测

SSD的继承：Seglink倾斜文字检测

当然文字检测算法也有传统的，比如这个OpenCV自带：

Real-Time Scene Text Localization and Recognition, CVPR 2012

不过不建议去折腾了，没必要。

别看论文多，能用且好用的方法基本就这几种，或者说是他们的变形和改进。

传统方法的优势就是速度快，即使在嵌入式平台也可以做到高速实时；缺点就是Precision/Recall都不是很理想，简单说就是效果差；

CNN方法优势就是Precision/Recall都好很多；缺点对应的，速度慢。

目前在嵌入式中，传统算法还有一些空间，但是被Mobilenet等轻量化网络挤压；在服务器端，完全是深度网络的天下了。

如果是新手，建议先了解Faster R-CNN/YOLO/SSD这3个算法，肯定就入门了；如果是老司机，应该也不需要听我在这瞎吹。。。

--------------------------------------------------

常用的检测算法，已经有人造好轮子了：

--------------------------------------------------

还有，你想看的这里都有：机器学习随笔zhuanlan.zhihu.com

点一下不亏的，相信我！

嗯，觉得还行请点个赞呗。

weixin_39522423

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。