【2015-CVPR】Fully Convolutional Networks for Semantic Segmentation

PRSer_Carrot

已于 2022-11-15 10:10:48 修改

阅读量1k

点赞数

分类专栏：星夜鱼塘文章标签：计算机视觉深度学习人工智能

于 2022-11-10 17:02:30 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42672745/article/details/127773587

版权

星夜鱼塘专栏收录该内容

18 篇文章 0 订阅

订阅专栏

概述

卷积网路自身逐像素端到端训练效果好于目前的SOTA语义分割网络，本文提出了FCN可接受任意大小输入并推理学习产生对应大小输出，它将来自深层的粗糙层语义信息和来自浅层的精细的外观信息相结合，该网络在PASCAL VOC上获得了SOTA。

Paper
~~Code~~

总结

创新点：
- 1.端到端，逐像素预测，自监督预训练
- 2.接受任意大小输入，推理并学习产生相应大小输出
- 3.将浅层信息与深层信息相结合
不足：
分析：将全连接层改为了卷积层生成热力图，然后再加上个反卷积
结论：SOTA、end-to-end、pixels-to-pixels

1. Introdution

先前的语义分割网络，每个像素都用其包围的对象或区域的类别来标记，但是这就有其固有缺点。本文所提FCN的学习和推理，都是通过在一张整图上进行一次性密集的前馈计算和反向传播来执行的。网络内的上采样层通过二次采样池实现网络中的逐像素预测和学习。所提方法未用到前处理后处理的一些复杂方法

2. Related Work

全卷积网络已用于处理任意尺寸输入，也被拓展到现在的多层网络之中，但是还不能实现端到端的训练；目前卷积网络的密集预测包含的共同要素如下：P2

限制容量和感受野的小模型
局部训练
后处理（超像素投影、随机场正则化、滤波或局部分类）
由OverFeat引入的密集输出的输入位移和输出交错
多尺度金字塔处理
饱和双曲正切非线性

本文所提方法在深度分类网络的基础上使用监督预训练，微调，来实现从整个图像输入和整个图像真值中学习。

3. FCN

3.1 针对密集预测调整分类器

在这里插入图片描述

论文精读及分析：Fully Convolutional Networks for Semantic Segmentation

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。