现在开始讨论物体检测。
还是从博客及论文开始大量学习。
1.https://www.cnblogs.com/love6tao/p/7351952.html《一篇文章看懂物体检测的发展脉络》
计算机视觉:
第一个层次是图像分类、物体检测、语义分割
第二个层次是3D重建
第三个层次是视觉问答
物体检测典型思路:确定目标位置+置信度分类
确定目标位置方法:
滑动窗口穷举遍历;启发式方法,region proposal method,如Selective Search
置信度分类:
图像模板匹配,计算相关性;
事先知道三维形状,进行匹配;
图像特征表达,欧氏距离匹配;
SIFT\HOG\LBP特征+SVM等分类器;
DPM:Pictorial Structure(弹簧模型,允许部件位置上的一定程度的不同)+HOG dectector
深度学习CNN提取特征然后分类{
R-CNN 系列:先产生region proposal,然后再去分类和回归。
SSD YOLO:一步到位
}
用CNN去解决检测问题的思路,基本就是这几个套路。其实还有一个方向我们并没有讨论,就是用神经网络去学习怎么做检测的后处理,例如非极大抑制(Non-Maximum Suppression)等。这类工作关注的人相对比较少,所以相关的工作也不多。不过在上面介绍的几个基本框架下,可以研究的细节还有很多,例如怎样去处理好物体的尺度问题,物体的形变问题,怎样用多任务学习来提高物体检测的性能,怎样去最好context和detail之前的平衡等等,我们就不在此做详细讨论了。
在物体检测领域,对细节的处理直接影响到模型最终的结果
2. https://www.cnblogs.com/sddai/p/5696870.html 《准确率(Accuracy), 精确率(Precision), 召回率(Recall)和F1-Measure》
精确率就是有没有误检的,如果有,正确的占比多大
召回率就是有没有漏检的,如果有,检测出来的占比多大
注意理解 TP FP