《深度学习理论与实战:提高篇》学习笔记-视觉篇–01
http://fancyerii.github.io/books/vision-tasks/
常见的图像识别任务包括图像分类(Image Classification)、目标检测(Object Detection)、语义分割(Semantic Segmentation)和实例分割(Instance Segmentation)
-
图像分类(Image Classification)
它的输入是一张图片,输出其类别。图像分类判断图片中是否存在某类(一个或者多个)物体。 -
目标检测(Object Detection)
目标检测除了需要检测出图片中包含的目标物体,同时还需要标注一个Bounding box——一个包含物体每一个像素的最小矩形框。一个图片中可能包含多个目标物体,因此目标检查需要检测出所有的目标物体,同时还要通过Bounding box定位(localize)它们。 -
语义分割(Semantic Segmentation)
语义分割需要判断每个像素属于哪个类别。 -
实例分割(Instance Segmentation)
实例分割需要判断每个像素属于哪个实体。