今天看了一篇文章,用稀疏表示进行图像分类。现如今,大家都在往稀疏表示这个大坑里灌水,真的是如火如荼啊~师兄也准备搞关于稀疏表示的论文,我也就站在稀疏表示的大门口准备向里面张望一下~结果就被老刘逼着赶紧改那篇不靠谱的计算机转机械应用的论文,我嘞个去,逼死我吧~
以上均属个人吐槽,各位看官表介意哈~
l文章出处
ØCVPR10(oral)
l相关文章
ØYang et al. Linear spatial pyramid matching using sparse coding for image classification. CVPR’09.
内容:
- 针对分类任务,提出了一种新颖的基于局部图像描述子的监督分级稀疏编码模型。
- 通过back-projection方法,以最小化在图像层级特征(image level features)的分类误差训练监督词典。其中图像层级特征是以空间金字塔为结构max pooling稀疏编码。在多种空间尺度下max pooling方法具有平移不变的特性,如同CNN(Convolutional Neural Network)一样。
- 实验证明,与无监督词典相比,监督词典明显地改善了模型的性能,并且在多个图像数据库拥有最好的表现。
- 另外,监督模型目标是学习线性特征,它蕴含了一个巨大潜能-实时地处理大规模数据库
拟解决的问题
lImage classification
ØTo find a generic feature representation
ØInterested in linear prediction model
以前的方法
Histogram-based SPM feature
ØStep 1: local descriptor extraction
ØStep 2:vector quantization (e.g.k-means)
ØStep 3:hierarchical average pooling
ØStep 4:nonlinear SVM
本文的方法
The framework of ScSPM(CVPR09)
ØStep 1: local descriptor extraction
ØStep 2:sparse coding (无监督词典)
ØStep 3:hierarchical max pooling(提取最大的稀疏系数)
ØStep 4:linear SVM
相关知识(1):
稀疏表示&取稀疏系数的最大值
分级融合模型:
本文Model(1):
求解方法1:
:Squared hinge loss function
:Only cares about the pooled maximum values
:Linear prediction model
:No analytical link,其中:
求解方法2:
文章主页包含代码下载:
http://www.ifp.illinois.edu/~jyang29/ScSPM.htm