【深度学习】一文读懂图像分类、目标定位、语义分割与实例分割的区别

本文介绍了深度学习在图像处理中的四个关键任务:图像分类、目标定位、语义分割和实例分割。图像分类确定图片类别,目标定位则找出目标位置,语义分割将图像像素按类别划分,实例分割能区分同一类别不同对象的像素。这些任务层层递进,构成了深度学习图像理解的基础。
摘要由CSDN通过智能技术生成

在做深度学习的图像研究时,经常会碰到图像分类、目标定位、语义分割及实例分割等概念。下图(来源于网络)展示了上述四个概念之间的区别。

在这里插入图片描述

首先来看第一个,图像分类。它是进行深度学习研究与学习的基本任务,其主要是在已知类别数量的情况下,通过输入一张图片,来判断图片所属类别。如图中所示,输入一张图片,它的输出为瓶子、杯子和立方体。

目标定位则是在图像分类的基础上,进一步判断图像中的目标具体在图像的什么位置,通常是以边界框(bounding box)形式进行定位。在目标定位中,通常只有一个或固定数目的目标,而目标检测更一般化,其图像中出现的目标种类和数目都不定。即如图二所示,目标检测需要把所有的对象都识别出来。

语义分割是目标检测更进阶的任务,目标检测只需要框出每个目标的边界框,语义分割需要进一步判断图像中哪些像素属于哪个目标。但是,语义分割不区分属于相同类别的不同实例。例如,当图像中有多只猫时,语义分割会将两只猫整体的所有像素预测为“猫”这个类别。

实例分割需要区分出哪些像素属于第一只猫、哪些像素属于第二只猫。

参考博客:https://blog.csdn.net/dxh0907070012/article/details/108631745
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

旅途中的宽~

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值