00 语义分割

Xlxlkkxx

已于 2023-05-18 15:42:39 修改

阅读量54

点赞数

分类专栏：语义分割文章标签：深度学习计算机视觉人工智能

于 2023-05-17 18:45:48 首次发布

本文链接：https://blog.csdn.net/weixin_63510030/article/details/130725958

版权

语义分割专栏收录该内容

4 篇文章 0 订阅

订阅专栏

本文介绍了语义分割任务常用的数据集格式，如PASCALVOC和MSCOCO，以及标注工具Labelme和EISeg。转置卷积用于上采样，膨胀卷积扩大感受野，但可能产生griddingeffect。解决方法包括调整膨胀系数和卷积层组合。

摘要由CSDN通过智能技术生成

5. 膨胀卷积（Dilated convolutio）

1. 语义分割任务常见数据集格式

PASCAL VOC

根据索引在SegmentationClass文件夹中找到相应的标注图像（.png）。在背景处的像素值为0，目标边缘处用的像素值为255(训练时一般会忽略像素值为255的区域)，目标区域内根据目标的类别索引信息进行填充，例如人对应的目标索引是15，所以目标区域的像素值用15填充。

单通道target为何看到的是彩色？

通过调色板，把单通道图转化为伪彩色图，详见 01FCN网络

MS COCO

针对图像中的每一个目标都记录了多边形坐标

2. 评价指标

公式

举例说明

3. 标注工具

Labelme

需要点点，把图像的边描出来

EISeg

Paddle开发的，只需要把物体框起来，会自动描边

4. 转置卷积

目的：上采样

运算步骤：

k表示转置卷积的kernel_size大小，s表示转置卷积的步距，p为转置卷积的padding

在输入特征图元素间填充s-1行、列0
在输入特征图四周填充k-p-1行、列0
将卷积核参数上下、左右翻转
做正常卷积运算（填充0，步距1）

示例：

5. 膨胀卷积（Dilated convolutio）

Pytorch中膨胀卷积和普通卷积共用一个API，只是通过膨胀因子的参数进行区分

膨胀因子设置为1时就是普通卷积。

torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, 
    dilation=1, groups=1, bias=True, padding_mode='zeros', device=None, dtype=None)

如图所示，间隔取数

膨胀卷积存在问题：gridding effect

可能导致原图感受野中部分元素未使用；见下图

如何解决上述问题？

假设都使用K*K的卷积核，连续多次卷积，膨胀系数应满足如下两条关系：

Mi 表示第i个卷积；ri表示第i个卷积的膨胀系数

M2 <= K

膨胀系数公约数不能大于1

也就是必须有普通卷积？例如r = [2 ,4，8]时，存在gradding effect

将r 设成锯齿结构（不是必须条件）

简单来讲就是重复所给定的一组系数，如r=[1,2,3,1,2,3],r=[1,2,5,1,2,5]类似这种格式

Xlxlkkxx

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录