卷积神经网络应用之图像分割

最新推荐文章于 2024-07-27 12:48:21 发布

时光机ﾟ

最新推荐文章于 2024-07-27 12:48:21 发布

阅读量7.6k

点赞数 1

分类专栏：深度学习文章标签： CNN 图像分割深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_19784349/article/details/78578570

版权

深度学习专栏收录该内容

10 篇文章 0 订阅

订阅专栏

SPP结构主要学自该博客：深度学习（十九）基于空间金字塔池化的卷积神经网络物体检测

FNC

FNC主要做的是基于像素的图像分割预测。其做法是先按照传统的CNN结构得到feature map，将传统的全连接层替换成相应的卷积层。如最后一层特征图尺寸为 $5*5*512$ ，对应的全连接层的尺寸为4096，则需要 $5*5*512*4096$ 个参数，将该参数变成卷积核，kernel size 为5*5，input channels 为512， output channels 为4096，依此将传统的带有卷积层和全连接层的网络变成全连接神经网络。

FNC的一个好处是它的输入可以是任意大小的。传统的CNN结构是在最后一个特征图的全连接层是需要固定大小的，比如上面的 $5*5*512* 4096$ 这里就确定了最后的特征图尺寸是 $5*5*512$ 。传统网络如果想要任意输入，就需要用一个类似SPP(Spatial Pyramid Pooling)的结构。该结构的大概过程就是通过不同层级（大小）的网格划分图片，在每个网格中做Pooling操作，再将每个网格得出来的值叠起来得到一个固定长度的向量，进入我们的全连接层。

CPP结构

SPP的工作流程图大概如上，该例图将图片分成3层，第一层用

4∗4 4 ∗ 4 $4*4$ 的网格划分，第二层用

2∗2 2 ∗ 2 $2*2$ 的网格划分，第三层把整个图片分为1块。则共有

16+4+1=21 16 + 4 + 1 = 21 $16+4+1=21$ 个网格块，通过对每个网格块进行Pooling操作可以得到21个输出可以用于全连接层。我们可以通过增加层级，以及改变每层的网格数得到不一样的input channels。

U-Net

U-Net网络架构设计

该网络初始用于医疗图像领域，目的是获得图像的边缘。
图中，蓝色代表卷积和激活函数，灰色代表复制，红色代表下采样，绿色代表上采样。

Autoencoder

自动编码器及其变种

关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。