Fully Convolutional Networks for Semantic Segmentation 论文解读

最新推荐文章于 2023-06-29 22:44:24 发布

一颗行走的大白菜

最新推荐文章于 2023-06-29 22:44:24 发布

阅读量867

点赞数

文章标签： semantic segmentation

本文链接：https://blog.csdn.net/qq_34650787/article/details/80164673

版权

写在前面：纯属个人理解，如有错误，请各位大佬赐教，小弟拜谢（一颗行走的大白菜）
这篇文章证明了，通过fine-tune 做分类的networks(AlexNet ,VGGnet,GoogleNet)，去做semantic segmentation，在效率和精度上都out performance the-state-of-art.这篇paper 由此开辟了用deep learning 的方法做 semantic segmentation 的时代。这里先给出这几年用深度学习做semantic segmentation 的一个review。如下图

一介绍

作者改造classification Networks 的想法不是第一人，在此之前，已经有人通过改造classification Networks 在object detection ，part and key-point prediction 取得过较好的results。第一个改造 classification network 变成 fully convolutional network 的the author 也不是第一个。但是改造classification network 来做 semantic segmentation 并且取得很好的结果作者是第一人，由此引发了用deep learning 研究 semantic segmentation 的热潮。由此可见，你写的文章可以不是第一提出ideal 的，但也可以写出影响力的paper（想发paper的童鞋停留3秒想一下。。。）。作者提出模型的得意之处在于两点：
this is the first work to train FCNs end-to-end (1) for pixelwise prediction and (2) from super- vised pre-training.

这篇paper的工作很大，体现在，作者改造了AlexNet，VGG16, googleNet (这个网络fine -tuning 后的效果不太好，z在paper中一笔带过)，这三个网络，每个网络又分三个层次fine-tuning ,比如：fcn-32s,fcn-16,fcn-8s.另一方面the author 测试了3个数据库：PASCAL VOC ,NYUDv2,SIFT Flow,每个数据库上又与之前很多方法进行比较。

二模型介绍

先给出可视化的网络架构图，以sift-fcn32s,sift-fcn16s,sift-8s.为例。其他的模型github上自取 https://github.com/shelhamer/fcn.berkeleyvision.org

fcn32 ，fcn16，fcn8 整体示意图：
这里写图片描述
图一

fcn32s网络结构图

，这里不给出一一解释，想了解具体参数的，可以参考源代码。由于图太长，我只好分两部分分别展示：这里写图片描述

先看左边，再看右边，这是fcn32网络结构图。

fcn-16s网络结构图

对照着，图一的fcn16的示意图来看。
这里写图片描述

fcn-8s网络结构图

同理可以对照着，图一的fcn-8s来看

这里写图片描述

总结：只要把其中一个模型的代码弄清楚，其他的模型都很类似，不一一介绍。
一颗行走的大白菜

一颗行走的大白菜

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Fully Convolutional Networks for Semantic Segmentation 论文解读

写在前面：纯属个人理解，如有错误，请各位大佬赐教，小弟拜谢（一颗行走的大白菜）这篇文章证明了，通过fine-tune 做分类的networks(AlexNet ,VGGnet,GoogleNet)，去做semantic segmentation，在效率和精度上都out performance the-state-of-art.这篇paper 由此开辟了用deep learning 的方法做 s...
复制链接

扫一扫