Development
Traditional ways:
2001: Viola-Jones
Paul Viola和Michael Jones在论文《Robust Real-time Object Detection》提出,使得低处理能力的傻瓜相机得以进行实时的面部识别
Ways of deep learning
2013: OverFeat
NYU(纽约大学) 提出一个使用卷积神经网络(CNNs)来处理多尺度滑窗的算法。
2014: R-CNN
加州大学伯克利分校的Ross Girshick及其同事就发表了Regins with CNN features,该方法在物体识别挑战中有50%的效果提升。
2015: Fast R-CNN
Ross Girshick(目前在微软研究中心)发表
###2015: Faster R-CNN
Shaoqing Ren(依然与Girshick合著,目前在Fackbook研究中心)发表,这是R-CNN的第三次迭代。
2016: YOLO
Joseph Redmon(与Girshick等人合著)发表了You Only Look Once:Unified, Real-Time Object Detection(YOLO)这篇论文。YOLO提出了一个兼具准确性和速度性的简单的卷积神经网络,首次实现了实时物体检测。
Others
Single Shot Detector(SSD) 和 Region-based Fully Convolutional Networks(R-FCN)。 前者在YOLO的基础上使用多尺寸的卷积特征图使得在结果和速度上都有提升。后者基于Faster R-CNN的架构,但是只使用了卷积网络。