图像语义分割(4)- DeepLab_v1

DeepLab_v1是FCN与CRF结合的图像语义分割算法。前端采用VGG-16改造的网络结构,后端利用全连接条件随机场(CRF)进行精细化调整。CRF通过一元势和成对势函数优化分割结果,提高边界准确性。文章详细介绍了DeepLab_v1的网络结构、CRF优化过程及其在图像分割中的应用。
摘要由CSDN通过智能技术生成

简单来说,DeepLab_v1【1】就是 FCN + CRF(条件随机场)

按文章《【总结】图像语义分割之FCN和CRF》的说法,以DeepLab为代表的现代图像分割算法普遍开始用 前端(FCN)粗提取 + 后端(CRF/MRF)优化 的通用框架(图1)

               这里写图片描述
                     图1. 前端粗提取+后端迭代优化

如图1所示,DeepLab使用FCN获得粗糙的 Score map,经过二次插值(与FCN不同的地方)后,使用全连接条件随机场做优化


前端FCN分割

1)VGG-16 的修改
参考文章《【Deep Learning】DeepLab》将网络最后的 FC6、FC7 全连接层改成卷积层。

FCN不同的是,摒弃“第一层对原图加 100 padding 的粗糙做法”,而是“将 pooling 层(pool4和pool5)的 stride 改为 1”

为了弥补由于 stride 变小带来的感受野缩小的问题,在后面的 conv5_1、conv5_2、conv5_3和 fc6 增加孔洞参数

   这里写图片描述
                  图2. 上半部分是 vgg-16 网络结构,下半部分是 DeepLab 改造的结构

图2里 fc8_pascal 的输出就是 8s 的feature map,然后再做个二次插值就变成原图大小

2)输出类别
将原来的 1000 类改为 21 类。同时把损失函数改为交叉熵

3)加速
将 fc6 的卷积核降采样到 44 ,同时该层输出由 4096 减小到 1024


后端CRF精修

后端 CRF 不参与训练,直接在前端输出的结果上做迭代调整

全连接条件随机场

关于条件随机场,可以参考文章《如何轻松愉快地理解条件随机场(CRF)?》。简单来说就是,定义一组特征函数来描述事件之间的概率,所谓的条件就是,所有这些事件的当前的一个组合

文章《CRF as RNN语义分割》里对全连接条件随机场有很好的总结,可惜没写完。以下内容参考此篇文章

如图3所示,定义 xi 为像素点 i 的分类标签,其取值就是我们要分类的语义标签; yi 为每个随机变量 xi 的观测值,即该像素的颜色(亮度)值。条件随机场的语义分割的目标就是:通过观测变量 yi ,推理出变量 xi 的值

                这里写图片描述
                     图3. 条件随机场图模型

如图3所示,为图模型 G=(V,E) ,其中 V={ x1,x2,...,xn} 为顶点;对于边,有稀疏条件随机场和全连接条件随机场之分:
1)稀疏条件随机场:每对相邻(4邻域、8邻域)的像素点可以构成一条边
2)全连接条件随机场:每个像素点与所有其他像素点相连,可以想象,这样的计算量是非常大的。文献【2】给出了快速推理算法

条件随机场目标函数

一般来说,CRF 的目标函数包含两部分:一元势函数、成对势函数。前者考虑本身(像素)的性质,后者考虑自身与其他点的关系

E(x)=iΨu(xi)+EΨp(xi,
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值