图像分割任务中的尺度问题

最新推荐文章于 2024-06-14 11:28:34 发布

lanyuxuan100

最新推荐文章于 2024-06-14 11:28:34 发布

阅读量8.5k

点赞数 4

分类专栏： Deep Learning Computer Vision 文章标签：网络

本文链接：https://blog.csdn.net/lanyuxuan100/article/details/70215830

版权

本文探讨了图像分割任务中的尺度问题，介绍了FCN、SegNet和DeepLab等网络结构如何通过全卷积、对称编码解码、带孔卷积等方法处理尺度变化。此外，还阐述了金字塔解析网络（PSPNET）如何利用金字塔池化模块融合不同尺度的信息，以解决多尺度问题。

摘要由CSDN通过智能技术生成

在图像的目标检测任务中，由于目标尺寸变化，需要在不同的尺寸下对目标进行检测，从而演化出许许多多解决目标检测任务中的尺度问题的方法，比如Fast-RCNN，及Faster-RCNN及后面的SSD,YOLO等网络。
那么在场景解析任务中是否存在尺度问题呢？答案是肯定的。
场景解析在这里确切地说是基于图像的像素级别的语义分割，不同尺寸的物体需要在不同的感受野范围内才能相对容易的将其与背景分割开来。那么如何解决不同的场景或分割的目标需要不同尺寸感受野的问题呢？也即是如何解决分割任务中的尺度问题呢？

在图像目标检测任务中，我们知道目前有许多深度学习网络使用基于SPPNET演化而来的多种尺寸的特征进行融合的方式来解决尺度变化的问题。而在图像分割任务中，同样可以采用类似的思想，例如PSPNET中的金字塔解析网络、Refine-NET中图像的多级处理等；
首先，让我们从两方面回顾一下，图像分割任务的发展历程：
（1）从使用的数据集看图像分割；
早些时候的场景解析任务是对2668张图片分出33个场景，以LMO dataset为代表；
稍微近一些的是PASCAL VOC数据集上，在相似的物体上提供了更加详细的标签；比如椅子和沙发，马和牛等；
之后出现的KITTI与CityScapes上都有语义分割任务，比如道路可通行区域等。
最近的ADE20K dataset是最有挑战性的一个数据集，提供了尺度变化更大、词汇内容丰富且类别更多的数据。
从使用的数据集发展由易到难上能够看出图像语义分割的逐步发展，这些进步与软硬件设备尤其是软件算法的长足进步是牢不可分的。

最低0.47元/天解锁文章

lanyuxuan100

关注

4
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
图像分割任务中的尺度问题

在图像的目标检测任务中，由于目标尺寸变化，需要在不同的尺寸下对目标进行检测，从而演化出许许多多解决目标检测任务中的尺度问题的方法，比如Fast-RCNN，及Faster-RCNN及后面的SSD,YOLO等网络。那么在场景解析任务中是否存在尺度问题呢？答案是肯定的。场景解析在这里确切地说是基于图像的像素级别的语义分割，不同尺寸的物体需要在不同的感受野范围内才能相对容易的将其与背景分割开来。那么如何
复制链接

扫一扫

专栏目录