图像局部视觉特征:SIFT、HOG、LBP
图像描述:兴趣点检测、局部图像块描述方法、词包模型三者结合
词包模型:1、特征提取;2、特征编码;3、特征汇聚;4、分类器训练。
特征编码:
局部特征描述子进行Kmeans聚类构造图像的视觉的码本,(一个聚类中心对应一个视觉单词,所有视觉单词构成视觉码本)码本构成后,用最邻近的方法将局部特征映射到对应的码字上,统计局部特征在视觉码本出现的概率,构建图像的直方图描述。VQ(vector quantization)SC(sparse coding) LLC(locality constrained linear coding)
特征汇聚:编码后更好的特征表达。SPM(spatial pyramid matching)均匀分块,块内用max pooling。
分类器:最邻近、boosting、SVM有效完成目标检测与识别,分开背景和目标(原理:非线性变换将低维空间中的点映射到高位空间,是这些点线性可分,再使用线性判别函数实现低维空间的非线性判别函数实现目标分类。)
视觉模型:自底向上(bottom-up)自顶向上(top-down)
自底向上显著图(滑动窗口)自顶向下显著图(CRF condition random fields和字典联合)
超像素分割算法:基于梯度下降的算法、基于图论的方法。
简单线性迭代聚类SLIC (simple linear iterative clustering )
显著性检测——目标分类
超像素(分割图像)——初始显著图(convex-hull prior和local contrast prior)——最终显著图(smoothness prior)——最显著区域作为目标的近似区域——分割该区域(OSTU方法)——提取特征——词包模型——分类器
central bias
显著区域为中心的空间合并(SCP salient region centric pooling )前景区域 背景区域
滑动窗口显著性检测
max-margin