PyTorch语义分割系列——DeepLabv3+

VAMOT

已于 2024-08-12 11:24:14 修改

阅读量1.5k

点赞数 20

分类专栏： PyTorch语义分割系列文章标签： pytorch 人工智能 python 深度学习计算机视觉

于 2024-08-09 19:20:42 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_48633207/article/details/141061269

版权

一、模型概览

DeepLabv3+由Encoder与Decoder两部分构成。Encoder主要包括backbone（骨架/底模）和ASPP，及对ASPP输出的降维。backbone可以使用ResNet、Xception等。

二、ASPP

简单来说，ASPP将backbone提取出的特征图输入多个平行且不同的层（如卷积层、空洞卷积层、池化层），然后将获得的多个输出拼接。

class ASPP(nn.Module):

    def __init__(self, in_channels=2048):
        super(ASPP, self).__init__()
        self.conv1 = ConvLayer(in_channels, 256, 1, padding=0)
        # rate = 6
        self.conv2 = ConvLayer(in_channels, 256, 3, padding=6, dilation=6)
        # rate = 12
        self.conv3 = ConvLayer(in_channels, 256, 3, padding=12, dilation=12)
        # rate = 18
        self.conv4 = ConvLayer(in_channels, 256, 3, padding=18, dilation=18)
        # image pooling
        self.pooling = nn.AdaptiveMaxPool2d((1, 1))
        self.conv5 = ConvLayer(in_channels, 256, 1, padding=0)
        # extract feature from ASPP output
        self.conv6 = ConvLayer(256 * 5, 256, 1, padding=0)

    def forward(self, x):
        o1 = self.conv1(x)
        o2 = self.conv2(x)
        o3 = self.conv3(x)
        o4 = self.conv4(x)
        o5 = self.pooling(x)
        o5 = self.conv5(o5)
        o5 = F.interpolate(o5, scale_factor=x.shape[-1], mode='bilinear')
        o = torch.cat((o1, o2, o3, o4, o5), dim=1)
        o = self.conv6(o)
        return o

图中rate = 空洞卷积的dilation
Image Pooling由池化层、卷积层、上采样构成

最低0.47元/天解锁文章

博客等级

码龄5年

14
原创

109
点赞

167
收藏

104
粉丝

关注

私信

热门文章

分类专栏

PyTorch语义分割系列 3篇
PyTorch图像分类系列 3篇

最新评论

PyTorch图像分类系列——ViT
VAMOT: num_classes参数是类别数量
PyTorch图像分类系列——ViT
zuoyizhongguo: 这个怎么就改为自己的类别数。比如一般的模型可以这样，classes是自己的类别数，如2分类 model.fc = nn.Linear(model.fc.in_features, classes) # 用于googlenet model.classifier[1] = nn.Linear(model.classifier[1].in_features, classes) # 用于efficientnet
PyTorch图像分类系列——流程概览
普通网友: 学到了，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
PyTorch图像分类系列——流程概览
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
Transformer 位置编码（Positional Encoding）
CSDN-Ada助手: 恭喜作者发布了第8篇博客，标题为“Transformer 位置编码（Positional Encoding）”。内容深入浅出地介绍了Transformer的位置编码，让我受益匪浅。希望作者能够继续分享更多关于深度学习的知识，可以考虑探讨Transformer在不同任务上的应用，或者深入研究Transformer网络结构的优化方法等方面的内容。期待您的下一篇精彩文章！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

VAMOT 您的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。