语义分割1：PSPNet学习总结

风的暖色调

已于 2024-03-11 21:04:23 修改

阅读量757

点赞数 9

分类专栏：语义分割文章标签：计算机视觉

于 2024-03-11 00:31:27 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_73954489/article/details/136612220

版权

语义分割专栏收录该内容

3 篇文章 0 订阅

订阅专栏

本文介绍了PSPNet，一种用于解决语义分割和场景解析难题的深度学习模型，它通过金字塔池化模块增强上下文信息。文中详细阐述了提出的优化策略，包括深度监管损失的应用和构建的实用系统。

摘要由CSDN通过智能技术生成

论文：https://arxiv.org/abs/1612.01105

1. 什么是PSPNet？

PSPNet(金字塔场景解析网络)，用于场景解析和语义分割，为了挑战开放词汇和复杂场景而提出。

PSPNet利用全局上下文信息和金字塔池化模块，分层次（等级）提取不同区域的上下文信息并聚合，为像素级场景解析提供有效的上下文信息。

网络架构简述：基于ResNet50框架，金字塔池化模块

2.论文中提到的三个贡献

• We propose a pyramid scene parsing network to embed difficult scenery context features in an FCN based pixel prediction framework.

• We develop an effective optimization strategy for deep ResNet [13] based on deeply supervised loss.

• We build a practical system for state-of-the-art scene parsing and semantic segmentation where all crucial implementation details are included.

提出金字塔场景解析网络，将困难场景的上下文特征嵌入到基于像素级预测的FCN中。
对基于深度监管损失的深层ResNet提出一个有效的优化策略。
为SOTA场景分析和语义分割（包括所有关键的实现细节）建立一个实用的系统。

图（1）

2.1为什么要提出PSPNet？

首先介绍一下FCN，目前参考FCN博客，后续我会在自己的专栏中写有关FCN的文章。

FCN(全卷积神经网络)的缺点（为什么要提出PSPNet）：

①缺乏收集上下文信息的能力增加了错误分类的机会，存在不匹配的关系

图（1）第一行，由于却少上下文信息（大白话讲就是：以经验来讲，靠近汽车几乎不在河上行驶，相反船是在河上行驶），将船错误分类为车

②像素与像素之间的关系弱，缺乏空间一致性，会产生混淆种类

图（1）第二行，标签“建筑物”和“摩天大厦”混淆

③感受野（接受场）小：对复杂场景中不显眼的类不友好，大物体可能超过FCN的感受野区域，导致不连续的预测

PSPNet的作者因此提出PSPNet：专注于维护上下文信息，关注不同子区域，加强像素间的联系

2.2 pyramid scene parsing network

PSPNet网络框架如下：

PSP网络结构 — PSPNet网络结构

首先使用卷积神经网络提取特征，将最后一个卷积层的特征映射（b），经过金字塔卷积池化模块获取不同子区域的表示，紧接着进行上采样和连接层，得到最终的同时携带局部和全局上下文信息的特征表示（c），最后将特征表示进行卷积得到最后的像素级预测（d）

c:为了维护全局特征的权重，在每一个金字塔层后使用1×1卷积层减小上下文的维度表征到原始金字塔输入尺度N的1/N

2.3 为什么提出金字塔池化模块呢？

在深层神经网络中，感受野（接受场）的大小可以大致表示我们使用了多少的上下文信息

理论上来说ResNet的感受野远大于输入图片的大小，但经验上来说,CNN的感受野比理论感受野小很多（特别实在深层网络），使得很多网络不能有效地合并全局重要的场景先验。

直接将像素融合成一个单一的向量也许会丢失空间关系造成模糊的结果（如混淆种类），但是全局上下文的信息和子区域上下文一起有助于区分不同的种类。为了进一步减小不同子区域之间的上下文损失，作者提出了分层的全局先验，包含不同尺度且在不同子区域之间变化的信息。

实验结果表面使用平均池化的效果优于最大池化。

2.4 基于深度监管损失的ResNet的优化策略是什么？

优化策略：在每个块中引入跳跃连接，通过监督生成初始结果并在最后的损失函数中学习残差；

训练阶段额外损失函数和辅助损失函数通过所有的层，辅助损失帮助优化学习进程，同时主分支分支在表征能力方面占主导地位。

测试阶段放弃辅助分支，仅仅使用优化过的主分支进行预测（速度）

风的暖色调

关注

9
点赞
踩
15

收藏

觉得还不错? 一键收藏
打赏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

风的暖色调 CSDN认证博客专家 CSDN认证企业博客

码龄2年

10: 原创

131万+: 周排名

10万+: 总排名

1万+: 访问

: 等级

210: 积分

66: 粉丝

107: 获赞

7: 评论

112: 收藏

私信

关注

热门文章

分类专栏

最新评论

第3章：归一化
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
深度可分离卷积Dwconv
CSDN-Ada助手: 恭喜用户发布了关于“深度可分离卷积Dwconv”的博客！持续创作是非常了不起的事情，你的研究和分享对于我们这些学习者来说都是非常有价值的。在下一步的创作中，或许可以深入探讨Dwconv在特定领域的应用案例，或者结合其他相关技术进行比较分析，这样可以更全面地了解和探讨这一主题。期待你更多精彩的文章，加油！
语义分割3：U-Net++学习总结
CSDN-Ada助手: 恭喜用户在语义分割领域的学习上取得了新的进展，看到您分享的关于U-Net++的学习总结，让我也受益匪浅。希望您能继续保持这种学习的热情和创作的动力，不断深入研究，扩展内容的广度和深度，相信您一定会有更多有价值的成果。期待您在未来的博客中能够分享更多关于语义分割的学习心得和应用实践经验。加油！
语义分割1：PSPNet学习总结
不会喷火的小火龙: 写挺好的
语义分割1：PSPNet学习总结
qq_35284542: 已下单，孩子很喜欢吃

大家在看

Java毕业设计之“修仙之路”：从码农到咸鱼的自我救赎 1334

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

风的暖色调 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。