图像分割任务中的尺度问题

本文探讨了图像分割任务中的尺度问题,介绍了FCN、SegNet和DeepLab等网络结构如何通过全卷积、对称编码解码、带孔卷积等方法处理尺度变化。此外,还阐述了金字塔解析网络(PSPNET)如何利用金字塔池化模块融合不同尺度的信息,以解决多尺度问题。
摘要由CSDN通过智能技术生成
在图像的目标检测任务中,由于目标尺寸变化,需要在不同的尺寸下对目标进行检测,从而演化出许许多多解决目标检测任务中的尺度问题的方法,比如Fast-RCNN,及Faster-RCNN及后面的SSD,YOLO等网络。
那么在场景解析任务中是否存在尺度问题呢?答案是肯定的。
场景解析在这里确切地说是基于图像的像素级别的语义分割,不同尺寸的物体需要在不同的感受野范围内才能相对容易的将其与背景分割开来。那么如何解决不同的场景或分割的目标需要不同尺寸感受野的问题呢?也即是如何解决分割任务中的尺度问题呢?

在图像目标检测任务中,我们知道目前有许多深度学习网络使用基于SPPNET演化而来的多种尺寸的特征进行融合的方式来解决尺度变化的问题。而在图像分割任务中,同样可以采用类似的思想,例如PSPNET中的金字塔解析网络、Refine-NET中图像的多级处理等;
首先,让我们从两方面回顾一下,图像分割任务的发展历程:
(1)从使用的数据集看图像分割;
早些时候的场景解析任务是对2668张图片分出33个场景,以LMO dataset为代表;
稍微近一些的是PASCAL VOC数据集上,在相似的物体上提供了更加详细的标签;比如椅子和沙发,马和牛等;
之后出现的KITTI与CityScapes上都有语义分割任务,比如道路可通行区域等。
最近的ADE20K dataset是最有挑战性的一个数据集,提供了尺度变化更大、词汇内容丰富且类别更多的数据。
从使用的数据集发展由易到难上能够看出图像语义分割的逐步发展,这些进步与软硬件设备尤其是软件算法的长足进步是牢不可分的。

  • 4
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值