参考链接:
https://blog.csdn.net/librahfacebook/article/details/103114747
https://blog.csdn.net/weixin_43196118/article/details/112346077
目标识别(Object Detection)就是从图像/视频之中识别出用户感兴趣的目标,反馈目标的位置和类别。目前主流的目标识别技术方案包括R-CNN,YOLO,SSD等,新的算法也层出不穷,网上有很多这方面的参考资料。这里就主流的上述几种算法做一个汇总。
1. R-CNN
R-CNN(Region with CNN features)2014年由Ross Girshick提出。Ross Girshick为Facebook人工智能研究院的研究科学家,从芝加哥大学获得博士学位,在微软研究院、加州大学伯克莱分校做过研究员。
其主要原理为针对一张图片建议大量(2千多个)的候选区域(Region),然后分别对这些区域进行目标识别计算,使用SVM进行分类。
在R-CNN基础上,后面有Fast R-CNN,Faster R-CNN等,Fast R-CNN由Ross Girshick于2015年提出,Faster R-CNN由其它研究人员同Ross Girshick共同提出。其中又有了Mask R-CNN,为Faster R-CNN的一个分支,由何凯明于2017年提出。
R-CNN
论文链接:http://arxiv.org/abs/1311.2524
项目链接: