计算机视觉——全卷积网络（FCN）的学习笔记

最新推荐文章于 2024-04-18 14:53:00 发布

songyuc

最新推荐文章于 2024-04-18 14:53:00 发布

阅读量386

点赞数

分类专栏：目标检测计算机视觉文章标签：全卷积网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/songyuc/article/details/103961152

版权

目标检测同时被 2 个专栏收录

62 篇文章 3 订阅

订阅专栏

计算机视觉

23 篇文章 3 订阅

订阅专栏

1 前言

最近语义分割的课程中讲到了全卷积网络FCN，感觉还是挺有趣的，

FCN有一些独特的特点，其中我觉得最重要的特点，就是：输入图像大小的任意性，不过这种任意性不是通过resize操作实现的；

从本质上来说，resize操作是不利于深度模型进行拟合，因为resize操作实际上改变的图像的细节，因为会设计到重采样的操作，

（我们看看PIL的resize()函数的声明，

Image.resize(size, resample=3, box=None, reducing_gap=None)

这里的resample就涉及到了重采样的操作，我们可以看看resample参数的说明，

resample – An optional resampling filter. This can be one of PIL.Image.NEAREST, PIL.Image.BOX, PIL.Image.BILINEAR, PIL.Image.HAMMING, PIL.Image.BICUBIC or PIL.Image.LANCZOS. Default filter is PIL.Image.BICUBIC. If the image has mode “1” or “P”, it is always set to PIL.Image.NEAREST. See: Filters.

这里的resample指的是，在重采样的过程中使用的算法）

3 备注

3.1 FCN的skip是做什么的？

用来特征融合，将高层次语义特征图，与低层次位置信息丰富的特征图进行融合，得到尺寸更大、信息更加丰富的特征图；

3.2 FCN为什么要在开始的时候padding=100？

解释一：来自GitHub官网，是为了适应之前的数据集；

解释二：为了保证最后的输出是7*7，

需要用到卷积层输出的计算公式

(i+2p-k)/s +1 = 7；

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。