计算机视觉能解决的问题------分类、检测、分割
分类:算法可以可以告诉我们图像的类别,但并不知道物体再图像中的位置。
检测:用矩形框把图像中的物体框出来,进行分类和定位。(一个图像中有多个物体多个类别,把每一个物体都用矩形框框出来进行分类)
分割:在检测的基础上获得更准确的抠图信息。
分割的分类------语义分割、实例分割
语义分割:对每一个像素分类不管这个像素是属于那几个物体的,只管他是什么类别的。
实例分割:要把同一个类别的不同实例区分出来。
目标检测的两个流派
One-stage detector:不提取候选框,直接把全图输入进算法里面,模型直接输出结果,一步到位,简单的端到端的输入输出。主要模型:YOLO、SSD、Retina-Net。优缺点:速度快,准确度相对低
Two-stage detector:先从图像中提取出若干候选框,再逐一的对候选框进行分类,检测,调整坐标等等。主要模型:RCNN、SPPNet,Fast RCNN、Faster RCNN等等,优缺点:准确率高,速度慢