本文思想
对称反卷积网络
摘要
1. 提出新的语义分割算法:深度反卷积网络;
2. 在VGG-16卷积层上学习网络;
3. 反卷积组成:deconvolution and unpooling layers,识别逐像素的类别标签,并预测分割mask;
4. 将object proposal(edge box)送入训练后的网络,然后整幅图像是这些proposal的分割结果的组合,这样就可以解决物体太大或者太小所带来的分割问题;
5. deep deconvolution network 和候选区域级别的预测(proposal-wise predictio),改进了现存的基于FCN的方法.
6. 我们的算法能识别精细的结构以及不同尺度大小的目标
引言
CNN被广泛的应用在各种视觉识别问题,例如图像分类,物体检测,语义分割,视觉追踪,动作识别。现在开始应用在结构预测问题,例如语义分割,人体姿态估计等等。
开始基于CNN解决语义分割逐像素分类的问题,将现存的用于分类的CNN结构转换成FCN。对图像中的局部区域进行分类,获得粗糙的label map,然后执行反卷积(双线性插值),从而获得像素级别的标签。为了获得更精确的分割效果,可以利用CRF进行后处理。FCN的最大优势:输入整张图像,获得较快,准确的推理。
FCN缺点:
第一,感受野为固定大小;物体大于或小于感受野会被 fragmented or mislabeled,大物体,分割不连续;小物体被忽视,如下图所示.虽然FCN加入了skip architecturer,但是这并不是根本的解决方案,根本问题–详细的边界和语义;
第二,输入反卷积层的label map太粗糙,反卷积过程太简单,使得物体的细节信息丢失或被平滑;在J.Long的FCN论文
Learning Deconvolution Network for Semantic Segmentation
最新推荐文章于 2021-09-27 10:28:21 发布
![](https://img-home.csdnimg.cn/images/20240711042549.png)