Super Parsing——基于Super Pixel 的非参数图像理解

SuperParsing算法通过结合region-based和per-exemplar detector对图像进行像素级的理解,尤其适用于thing类和stuff类目标的识别。首先,利用全局特征找到相似图片集,然后进行超像素分割,接着计算超像素的似然比得分,并通过MRF进行语义推导。最终,结合语义和几何标签进行联合分类,实现高效准确的图像解析。
摘要由CSDN通过智能技术生成

一. 简介

SuperParsing是一种图像理解的算法,它可以对对象内的物体进行label,label的种类可以有成百上千种,更主要的是,这种label是像素级的。

将图片中的目标分为两类:

(1) stuff类:占据大量像素,在图片集中实例很多,没有固定的形状(shape)但是有相对一致的纹理特征,比如天空、道路、建筑物、树林。

         这一类中的类别较少,一般的方法对这类的分类用像素或区域(region)级别的特征。

(2)thing类:在图片中占据较少像素,图片集中实例并不是很多,但是类别众多,是理解的重点,比如人、狗、车辆、标志牌等等。

Region级的特征能很好的表征目标整体的形状特点,却不合适形容细节。细节特征更好的特征处理方法是使用滑动窗(sliding window)。文章中

使用的特征提取方法是per-exemplar或者称为exemplar SVMs,详细的介绍在文献[4]中。这种特征提取方法可以将目标的边缘详细勾勒出,而

不是仅仅给出一个bounding box。在这里,使用region-based和per-exemplar detector分别对图像进行label,得到两个分类的得分,然后用SVM

得到最终的结果,如下图所示。


二 . Region-based 图像理解

具体名称为scalable nonparametric system,内容参考文献[2].

2.1 流程:

(1) 输入query图,提取全局特征;

(2)根据全局特征相似性,在训练集中找出一些类似图片(retrieval set);

(3)将query分割为super pixel;

(4)对每一类,计算super pixel的平均似然概率;

(5)依据super pixel在类似图片中的最近邻匹配,与马尔科夫随机域(MRF)模型结合,对query进行label。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值