Image Classification——Sparse Code

今天看了一篇文章,用稀疏表示进行图像分类。现如今,大家都在往稀疏表示这个大坑里灌水,真的是如火如荼啊~师兄也准备搞关于稀疏表示的论文,我也就站在稀疏表示的大门口准备向里面张望一下~结果就被老刘逼着赶紧改那篇不靠谱的计算机转机械应用的论文,我嘞个去,逼死我吧~
以上均属个人吐槽,各位看官表介意哈~
 
 
 
l文章出处
ØCVPR10oral
l相关文章
ØYang et al. Linear spatial pyramid matching using sparse coding for image classification. CVPR’09.
内容:
  • 针对分类任务,提出了一种新颖的基于局部图像描述子的监督分级稀疏编码模型。
  • 通过back-projection方法,以最小化在图像层级特征(image level features)的分类误差训练监督词典。其中图像层级特征是以空间金字塔为结构max pooling稀疏编码。在多种空间尺度下max pooling方法具有平移不变的特性,如同CNN(Convolutional Neural Network)一样。
  • 实验证明,与无监督词典相比,监督词典明显地改善了模型的性能,并且在多个图像数据库拥有最好的表现。
  • 另外,监督模型目标是学习线性特征,它蕴含了一个巨大潜能-实时地处理大规模数据库

拟解决的问题

lImage classification
ØTo find a generic feature representation
ØInterested in linear prediction model
 
以前的方法
Histogram-based SPM feature
ØStep 1: local descriptor extraction
ØStep 2:vector quantization  (e.g.k-means)
ØStep 3:hierarchical average pooling
ØStep 4:nonlinear SVM
本文的方法
The framework of ScSPMCVPR09
ØStep 1: local descriptor extraction
ØStep 2:sparse coding (无监督词典)
ØStep 3:hierarchical max pooling(提取最大的稀疏系数)
ØStep 4:linear SVM

 

 

相关知识(1):

稀疏表示&取稀疏系数的最大值

分级融合模型:
 
 
本文Model(1):
 
求解方法1:

:Squared hinge loss function

:Only cares about the pooled maximum values

:Linear prediction model

:No analytical link,其中:

 

 
 
求解方法2:
 
文章主页包含代码下载: http://www.ifp.illinois.edu/~jyang29/ScSPM.htm
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值