挖坑:暂时还没有理解的定义或者方法,但因为暂时不重要留到后面看
论文结构
一、引言
1、道路场景语义分割定义
针对道路场景进行语义分割是对采集到的道路场景图像中的每个像素都划分到对应的类别,实现道路场景图像在像素级别上的分类。
2、道路场景语义分割面临的挑战
- 精确性
首先要克服不同目标对象的相异性和相似目标对象的相似性;其次还要注意分割对象所处场景的复
杂性; 最后一些外界因素如光照,拍摄条件、 拍摄设备和拍摄距离的不同也会使得目标物体与图片上差异较
大,进而影响分割的效果
- 实时性
二、图像语义分割发展历史
语义分割发展总历史:
- 传统语义分割:主要依靠图像纹理、颜色以及其他一些简易的表层特征和外部结构特征进行图像分割。以此方式得到的分割结果相对粗陋,精度较低,且无相关标注,即只是将图像分割成了若干块,但每一块是什么不知道,需要人工指定。
- 传统方法与深度学习相结合的语义分割:首先使用传统方法对图像进行初步处理, 得到目标区域。而后使用卷积神经网络(CNN)对目标特征进行学习,形成合理的分类器,实现目标的自动标注。此时算法已经能够将图像分成若干个部分,并标注出每一个部分是什么。
- 基于深度学习的语义分割:取得的效果较前两种方法好
2.1传统图像语义分割算法
基于阈值的语义分割
基于边缘的语义分割
基于聚类的语义分割
基于图论的语义分割
- N-cut(Normalized cut)算法
- Grab cut 算法
基于区域的语义分割
2.1.1N-cut算法
算法参考文献:
Yang Yupeng, Zhao Weidong, Wang Zhicheng, et al. Research on image-based imagesegmentation[J].Computer and Modernization,2010(1):113-116.
杨宇鹏, 赵卫东, 王志成等.基于图论的Normalized Cut图像分割方法研究[J]. 计算机与现代化,2010(1):113-116
算法思路:
该分割方法以图片为单位,将其定义为“图”并作为分割图像的依据。以图为单位,然后计算权重图(weighted graph),然后将其分割成一些具有相同特征的区域。其中最小分割算法(Min-cut algorithm)作为其中的一个重要的方法。
最小化切割算法:
如下式一个图的权重图,我们要把他分成两部分,则沿着两条权重最小的0.1的边进行切割就是最小化切割。
算法缺点:
最小化切割也存在边缘角元素缺失等缺陷。
2.1.2Grab cut算法
参考文献:
Qiuhua Zheng,Wenqing Li, et al. An Interactive Image Segmentation Algorithm Based on Graph Cut[J].Procedia Engineering,2012,29
Han Xu. Research on Grabcut based Automatic Image segmentation algorithm [D]. Beijing: Beijing PrintingInstitute, 2018: 8-9
Liu Lei, Shi Zhiguo, Su Haoru, et al. Image segmentation based on high order Markov random fields [J].Computer research and development, 2013,50 (9): 1933-1942.
刘 磊 , 石 志 国 , 宿 浩 茹 等 . 基 于 高 阶 马 尔 可 夫 随 机 场 的 图 像 分 割 [J]. 计 算 机 研 究 与 发展,2013,50(9):1933-1942
算法思路:
利用到混合高斯模型以及吉尔斯能量方程, 基于RGB对图像进行建模,在求得方程最优解过程中采用迭代方式,最终获取高斯模型的最优参数解。从而实现图像分割。
算法缺点:
需要较好的算法初始化数值
2.1.3最新的传统语义分割算法
1)轮廓检测法
- 参考论文:
Pablo Arbeláez, Maire M , Fowlkes C , et al. Contour Detection and Hierarchical Image Segmentation[J].IEEE Transactions on Pattern Analysis & Machine Intelligence, 2011, 33(5):898-916.
- 算法思路:
首先利用 GPB 方法对任一像素作边缘的实际概率进行合理测算,而后基于该测算结果形成不同的闭合区域,随后利用 UCM 法使不同的闭合区间进行转化,形成层次分明的树状结构。
2)随机决策森林分割法
- 算法论文:
Zhang C , Xue Z , Zhu X , et al. Boosted random contextual semantic space based representation for visual recognition[J]. Information ences, 2016, 369:160-170
- 算法思路:
整体此路与轮廓法相似,但与轮廓法不同的是,该检测法主要由不同的决策树进行组合形成分类器对闭合区域进行分类。
3)MCG分割法
- 算法论文:
Pont-Tuset Jordi, Arbelaez Pablo, et