序
本文主要参考网上博客和文章,为后面r-cnn, fast-rcnn打好基础。
1 传统物体检测过程概览
1.1 图像数据库汇总
数据库 | 图像数 | 类别数 | 应用场景 | 图像大小 | 难度 |
---|---|---|---|---|---|
Mnist | 60000 | 10 | 字符识别 | 28*28 | 容易 |
Cifar10 | 60000 | 10 | 物体分类 | 32*32 | 中等 |
PASCAL VOC 20010-2012 | 9963 | 20 | 分类检测 | 470*380 | 很难 |
ImageNet | 1400万 | 10万 | 物体分类 | 500*400 | 很难 |
KITTI | 15000 | – | 车辆分类检测 | – | 中等 |
CompCars | 30000 | 281 | 车辆分类 | – | 中等 |
附数据集链接(知乎达人收集)
https://zhuanlan.zhihu.com/p/25138563
1.2 物体检测
传统物体检测是滑动窗口设计+特征提取+分类器的方式。
1) 滑动窗口设计:
穷举策略:图像中所有可能出现框的位置从左往右,从上往下遍历一次,并缩放一组图像尺寸,得到图像金字塔进行多尺度搜索。存在问题:时间复杂度高,窗口冗余。
2) 特征提取
Harr角点检测:提取多种边缘变化信息,快速计算。
LBP: 提取纹理信息,对均匀变化光照有很强适应性。
HOG: 对物体边缘使用直方图统计进行编码,特征能力强。
SIFT: 提取局部特征,具有尺度不变性。
特征设计需要研究者经验驱动,组合不同特征,进行调优。
3) 分类器设计
Adaboost, SVM, DT,RF等。