Semantic segmentation
文章平均质量分 96
计算机视觉之语义分割学习笔记
zzzyzh
一个不会踢足球的棋手不是好程序员
展开
-
SS-Model【5】:U-Net
在本文中,作者提出了一种网络和训练策略,该策略依赖于对数据增强的有力使用,以更有效地利用现有的注释样本。该架构由一个捕捉上下文的收缩路径和一个实现精确定位的对称扩展路径组成。UNet 的初衷是为了解决医学图像分割的问题,之后,UNet 凭借其突出的分割效果而被广泛应用在语义分割的各个方向(如卫星图像分割,工业瑕疵检测等)。深 / 浅层特征有着各自意义:网络越深,感受野越大,网络关注那些全局特征(更抽象、更本质);浅层网络则更加关注纹理等局部特征特征通过特征拼接来实现边缘特征的找回。原创 2022-09-12 23:55:34 · 864 阅读 · 0 评论 -
SS-Model【6】:U2-Net
U2Net 是基于 Unet 提出的一种新的网络结构,同样基于 encode-decode,作者参考 FPN 和 UNet,在此基础之上提出了一种新模块 RSU(ReSidual U-blocks)。经过测试,对于分割物体前、背景取得了惊人的效果。同样具有较好的实时性,经过测试在 P100 上前向时间仅为18ms(56fps)。在本文中,作者设计了一个简单而强大的深度网络架构 -- U-Net,用于显著性物体检测(SOD)。我们的 U-Net 的结构是一个两级嵌套的 U 型结构。由于我们提出的。原创 2022-09-25 15:39:34 · 1894 阅读 · 0 评论 -
SS-Model【4】:DeepLabv3
DeepLabv3 是在 DeepLabv1,DeepLabv2 的基础上发展而来。引入了 Multi-grid(设置膨胀系数)改进 ASPP 结构移除 CRFs 后处理(CRFs 给 mean IoU的提升很小)重新探讨空洞卷积显式地调整滤波器的视场控制由深度卷积神经网络计算的特征响应的分辨率采用级联或并行梯度卷积的模块解决多尺度分割对象的问题采用多尺度膨胀率来捕获多尺度上下文改进 ASPP 模块在多个尺度上探测卷积特征图像级特征编码全局上下文视频资料。原创 2022-09-05 14:53:26 · 1232 阅读 · 0 评论 -
SS-Model【3】:DeepLabv2
DeepLabv2是一个用于语义分割的架构,它建立在DeepLab的基础上,有一个无轨的空间金字塔集合方案。在这里,我们在输入特征图中应用了不同速率的平行扩张卷积,然后将它们融合在一起。由于同一类别的物体在图像中可能有不同的尺寸,ASPP有助于解释不同的物体尺寸。回顾下 DeepLab v1 ,其主要是在 FCN 的基础上对 VGG 网络进行调参 fine tuning,并在最后加上一个全连接的 CRF,保证对 FCN 得到的结果在局部细节(边界)上进行优化。原创 2022-09-03 16:41:34 · 4904 阅读 · 1 评论 -
SS-Model【2】:DeepLabv1
DeepLab是一个语义分割的架构。首先,输入的图像通过网络,使用扩张卷积。然后,网络的输出被双线性插值,并通过全连接的CRF来微调结果,我们得到最终的预测。深度卷积神经网络 (DCNN) 最近在高级视觉任务(例如图像分类和对象检测)中展示了最先进的性能。这项工作将 DCNN 和概率图形模型的方法结合在一起,用于解决像素级分类任务(也称为“语义图像分割”)。本文表明,DCNN 最后一层的响应没有充分定位到准确的对象分割。这是由于非常不变的属性使 DCNN 适合高级任务。原创 2022-09-03 11:37:28 · 1148 阅读 · 0 评论 -
SS【1】:转置卷积与膨胀卷积
本文首先回顾了普通的直接卷积操作,然后讲解了在语义分割中十分常见的两种卷积操作:转置卷积(Transposed Convolution)与膨胀卷积(Dilated Convolution)同时,还给出了相关实例,方便读者理解。具体的语义分割模型的网络结构讲解,可以参考博主主页中的其他blog转置卷积参考-1转置卷积参考-2膨胀卷积参考。...原创 2022-08-31 10:24:13 · 810 阅读 · 0 评论 -
SS-Model【1】:FCN
FCN是首个端对端的针对像素级预测的全卷积网络卷积网络原创 2022-07-24 15:41:03 · 690 阅读 · 0 评论