【深度学习】一文读懂图像分类、目标定位、语义分割与实例分割的区别

最新推荐文章于 2024-07-27 12:48:21 发布

旅途中的宽~

最新推荐文章于 2024-07-27 12:48:21 发布

阅读量1.7k

点赞数 1

分类专栏：深度学习笔记文章标签：深度学习计算机视觉目标检测目标分割

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wzk4869/article/details/127438651

版权

深度学习笔记专栏收录该内容

82 篇文章 40 订阅

订阅专栏

本文介绍了深度学习在图像处理中的四个关键任务：图像分类、目标定位、语义分割和实例分割。图像分类确定图片类别，目标定位则找出目标位置，语义分割将图像像素按类别划分，实例分割能区分同一类别不同对象的像素。这些任务层层递进，构成了深度学习图像理解的基础。

摘要由CSDN通过智能技术生成

在做深度学习的图像研究时，经常会碰到图像分类、目标定位、语义分割及实例分割等概念。下图（来源于网络）展示了上述四个概念之间的区别。

在这里插入图片描述

首先来看第一个，图像分类。它是进行深度学习研究与学习的基本任务，其主要是在已知类别数量的情况下，通过输入一张图片，来判断图片所属类别。如图中所示，输入一张图片，它的输出为瓶子、杯子和立方体。

目标定位则是在图像分类的基础上，进一步判断图像中的目标具体在图像的什么位置，通常是以边界框(bounding box)形式进行定位。在目标定位中，通常只有一个或固定数目的目标，而目标检测更一般化，其图像中出现的目标种类和数目都不定。即如图二所示，目标检测需要把所有的对象都识别出来。

语义分割是目标检测更进阶的任务，目标检测只需要框出每个目标的边界框，语义分割需要进一步判断图像中哪些像素属于哪个目标。但是，语义分割不区分属于相同类别的不同实例。例如，当图像中有多只猫时，语义分割会将两只猫整体的所有像素预测为“猫”这个类别。

实例分割需要区分出哪些像素属于第一只猫、哪些像素属于第二只猫。

参考博客：https://blog.csdn.net/dxh0907070012/article/details/108631745

旅途中的宽~

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

旅途中的宽~ 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。