准确度判断 语义分割_人工智能中图像分类、目标检测、语义分割和实例分割等任务是什么?...

本文介绍了计算机视觉中的核心任务——图像分类、语义分割、目标检测和实例分割,阐述了它们的定义、区别及应用场景,帮助理解这些任务的研究目标和关联。
摘要由CSDN通过智能技术生成

5555e799448dfa36f23cfd98b313b154.png

近年来,计算机视觉及其相关领域发展十分迅速,相关技术已经被应用到人类生产和生活的各个领域。

我们耳熟能详的任务有人脸识别、步态识别、虹膜识别、车辆检测以及医学图像处理等。 实际上,计算机视觉本身包含众多的研究方向,本文仅仅介绍下面几个互相关联的任务:

  • 图像分类:Image Classification
  • 语义分割:Semantic Segmentation
  • 目标检测:Object Detection
  • 实例分割:Instance Segmentation

需要注意的是,本文的目的并不是针对上述四种任务的发展与原理进行综述,而仅仅是指出几种任务的关联和区别,借以明确各自的研究目标。

概念与定义

下图展示了图像分类、语义分割、目标检测、实例分割四种任务(图片来自【1】):

fc8629f19bbc750ec9f0ffa59eaefccd.png

上图展示了四种任务的研究目标,具体如下:

  • 图像分类:判别图中物体是什么,比如是猫还是狗;
  • 语义分割:对图像进行像素级分类,预测每个像素属于的类别,不区分个体;
  • 目标检测:寻找图像中的物体并进行定位;
  • 实例分割:定位图中每个物体,并进行像素级标注,区分不同个体;

一、图像分类

图像分类任务目的是判断图像中包含物体的类别,如果期望判别多种物体则称为多目标分类。需要注意的是,基本的图像分类任务并不要求给出物体所在位置,也不需要判断含有物体的数量。下图中含有多种物体,分类任务的目标可以是判断图片中是否含有“狗”(图来自BigGAN):

178c2755546e20bcc13e4029547614e6.png

二、语义分割

语义分割任务需要对图像中所有像素点进行分类,将相同类别的像素归为相同的标签(常常采用相同的像素点表示)。需要特别注意的是,语义分割是在像素级别进行的。下图(来自FefineNet)中展示了街景分割,图中的街道、车辆、树木和行人等分别采用不同的颜色进行标注,即进行了语义级别的分割。

5b1e4d61b772a15f79e147308efbf78f.png

三、目标检测

如果项目的需求是精确的定位出图像中某一物体类别信息和所在位置,则应该选择目标检测算法。基于深度学习的目标检测算法主要分为单阶段(one-stage)和两阶段(two-stage)两种,单阶段算法的速度较快,两阶段算法的精度较高(总体上)。下图(来自YOLOv1)展示了各种目标检测任务,比如左边检测的目标是鹰,右边检测的目标是飞机,均精确的预测出了目标所在的位置

d0877e5eab833295bfe7c476066c2fd8.png

四、实例分割

相比于语义分割,实例分割不仅需要将图像中所有像素进行分类,还需要区分相同类别中不同个体。比如,语义分割只需要将下图中的所有猫的像素进行归类,而实例分割需要将猫这一类中单独的个体进行像素分类。

e143a2b28d32cefee9055717714faaa8.png

五、总结

上述的四种任务每一个都是非常值得研究的领域,均包含众多优秀的论文。其中图像分类任务最为基础,在ImageNet上训练得到的ResNet、Vgg、DenseNet和MobileNet等网络均在其它任务上被广泛应用,作为很多论文的Backbone网络。

参考:

【1】http://cs231n.stanford.edu/syllabus.html

【2】Redmon J, Divvala S, Girshick R, et al. You only look once: Unified, real-time object detection[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2016: 779-788.

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值