以下文章摘录自:
《机器学习观止——核心原理与实践》
京东: https://item.jd.com/13166960.html
当当:http://product.dangdang.com/29218274.html
(由于博客系统问题,部分公式、图片和格式有可能存在显示问题,请参阅原书了解详情)
1.1 R-CNN
近几年深度学习在图像视觉识别领域取得了长足发展,涌现出了R-CNN、Fast R-CNN、Faster R-CNN、ResNet等一批代表当前最高水平的神经网络算法框架。这些算法框架本身是有关联和继承性的——后继者们以“长江后浪推前浪”的架势不断改进着前人的不足,使得视觉识别领域得以源源不断地革新换代。
图 ‑ 深度学习在Object Detection中的应用效果
诞生于2014年的R-CNN可以说是深度学习在Object Detection领域的开山之作。R-CNN的全称为“Region based Convolutional Neural Network”,其第一作者是曾任职于Microsoft Research的Ross Girshick。与之相对应的Paper名为《Rich feature hierarchies for accurate object detection and semantic segmentation》,并且作者在Github上公布了源码,有兴趣的读者可以参考一下:
Paper: