PyTorch语义分割系列——FCN

VAMOT

已于 2024-07-28 16:09:19 修改

阅读量1.3k

点赞数 7

分类专栏： PyTorch语义分割系列文章标签： pytorch 人工智能 python 深度学习计算机视觉

于 2024-07-28 15:52:57 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_48633207/article/details/140751320

版权

一、核心思想

1、使用卷积层替换全连接层中的所有线性层

2、 FCN可分为底模/骨架（backbone）与头部（head）两个部分

底模用于提取特征，可以使用VGG16、AlexNet、ResNet等提取特征的部分
头部用于预测像素点的类别；因底模中存在下采样操作（如池化和步长为2的卷积层），头部需将图像上采样至原本大小

该图省略了卷积层，激活层等。Kx表示输出尺寸（H，W）是输入尺寸（H，W）的K倍。

3、FCNHead

头部包括全卷积层、跳跃结构与上采样（至原始尺寸）。
通常使用卷积核大小为1、步长为1无填充的卷积层预测，全卷积层的最后一层为该卷积层。

最低0.47元/天解锁文章

博客等级

码龄5年

14
原创

109
点赞

167
收藏

104
粉丝

关注

私信

热门文章

分类专栏

PyTorch语义分割系列 3篇
PyTorch图像分类系列 3篇

最新评论

PyTorch图像分类系列——ViT
VAMOT: num_classes参数是类别数量
PyTorch图像分类系列——ViT
zuoyizhongguo: 这个怎么就改为自己的类别数。比如一般的模型可以这样，classes是自己的类别数，如2分类 model.fc = nn.Linear(model.fc.in_features, classes) # 用于googlenet model.classifier[1] = nn.Linear(model.classifier[1].in_features, classes) # 用于efficientnet
PyTorch图像分类系列——流程概览
普通网友: 学到了，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
PyTorch图像分类系列——流程概览
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
Transformer 位置编码（Positional Encoding）
CSDN-Ada助手: 恭喜作者发布了第8篇博客，标题为“Transformer 位置编码（Positional Encoding）”。内容深入浅出地介绍了Transformer的位置编码，让我受益匪浅。希望作者能够继续分享更多关于深度学习的知识，可以考虑探讨Transformer在不同任务上的应用，或者深入研究Transformer网络结构的优化方法等方面的内容。期待您的下一篇精彩文章！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

VAMOT 您的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。