图像语义分割（4）- DeepLab_v1

最新推荐文章于 2024-08-19 09:04:27 发布

zizi7

最新推荐文章于 2024-08-19 09:04:27 发布

阅读量1.5k

点赞数 1

分类专栏：图像处理机器学习文章标签：图像语义分割 deeplab

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zizi7/article/details/77532163

版权

DeepLab_v1是FCN与CRF结合的图像语义分割算法。前端采用VGG-16改造的网络结构，后端利用全连接条件随机场(CRF)进行精细化调整。CRF通过一元势和成对势函数优化分割结果，提高边界准确性。文章详细介绍了DeepLab_v1的网络结构、CRF优化过程及其在图像分割中的应用。

摘要由CSDN通过智能技术生成

简单来说，DeepLab_v1【1】就是 FCN + CRF（条件随机场）

按文章《【总结】图像语义分割之FCN和CRF》的说法，以DeepLab为代表的现代图像分割算法普遍开始用 前端（FCN）粗提取 + 后端（CRF/MRF）优化 的通用框架（图1）

　　　　　　　　　　　　　　　这里写图片描述
　　　　　　　　　　　　　　　　　　　　　图1. 前端粗提取+后端迭代优化

如图1所示，DeepLab使用FCN获得粗糙的 Score map，经过二次插值（与FCN不同的地方）后，使用全连接条件随机场做优化

前端FCN分割

1）VGG-16 的修改
参考文章《【Deep Learning】DeepLab》将网络最后的 FC6、FC7 全连接层改成卷积层。

与FCN不同的是，摒弃“第一层对原图加 100 padding 的粗糙做法”，而是“将 pooling 层（pool4和pool5）的 stride 改为 1”

为了弥补由于 stride 变小带来的感受野缩小的问题，在后面的 conv5_1、conv5_2、conv5_3和 fc6 增加孔洞参数

　　　这里写图片描述
　　　　　　　　　　　　　　　　　　图2. 上半部分是 vgg-16 网络结构，下半部分是 DeepLab 改造的结构

图2里 fc8_pascal 的输出就是 8s 的feature map，然后再做个二次插值就变成原图大小

2）输出类别
将原来的 1000 类改为 21 类。同时把损失函数改为交叉熵

3）加速
将 fc6 的卷积核降采样到 $4*4$ ，同时该层输出由 4096 减小到 1024

后端CRF精修

后端 CRF 不参与训练，直接在前端输出的结果上做迭代调整

全连接条件随机场

关于条件随机场，可以参考文章《如何轻松愉快地理解条件随机场（CRF）？》。简单来说就是，定义一组特征函数来描述事件之间的概率，所谓的条件就是，所有这些事件的当前的一个组合

文章《CRF as RNN语义分割》里对全连接条件随机场有很好的总结，可惜没写完。以下内容参考此篇文章

如图3所示，定义 $x_i$ 为像素点 $i$ 的分类标签，其取值就是我们要分类的语义标签； $y_i$ 为每个随机变量 $x_i$ 的观测值，即该像素的颜色（亮度）值。条件随机场的语义分割的目标就是：通过观测变量 $y_i$ ，推理出变量 $x_i$ 的值

　　　　　　　　　　　　　　　　这里写图片描述
　　　　　　　　　　　　　　　　　　　　　图3. 条件随机场图模型

如图3所示，为图模型 $G=(V,E)$ ，其中 $V=\{x_1, x_2, ..., x_n\}$ 为顶点；对于边，有稀疏条件随机场和全连接条件随机场之分：
1）稀疏条件随机场：每对相邻（4邻域、8邻域）的像素点可以构成一条边
2）全连接条件随机场：每个像素点与所有其他像素点相连，可以想象，这样的计算量是非常大的。文献【2】给出了快速推理算法

条件随机场目标函数

一般来说，CRF 的目标函数包含两部分：一元势函数、成对势函数。前者考虑本身（像素）的性质，后者考虑自身与其他点的关系

E (x) = \sum i Ψ u (x i) + \sum E Ψ p (x i,

最低0.47元/天解锁文章

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。