Image Classification——Sparse Code

最新推荐文章于 2025-01-28 10:10:46 发布

小熊不去实验室

最新推荐文章于 2025-01-28 10:10:46 发布

阅读量6k

点赞数

分类专栏： matlab 计算机视觉文章标签： classification image descriptor 数据库 features vector

计算机视觉同时被 2 个专栏收录

39 篇文章

订阅专栏

5 篇文章

订阅专栏

今天看了一篇文章，用稀疏表示进行图像分类。现如今，大家都在往稀疏表示这个大坑里灌水，真的是如火如荼啊~师兄也准备搞关于稀疏表示的论文，我也就站在稀疏表示的大门口准备向里面张望一下~结果就被老刘逼着赶紧改那篇不靠谱的计算机转机械应用的论文，我嘞个去，逼死我吧~

以上均属个人吐槽，各位看官表介意哈~

l文章出处

ØCVPR10（oral）

l相关文章

ØYang et al. Linear spatial pyramid matching using sparse coding for image classification. CVPR’09.

内容：

针对分类任务，提出了一种新颖的基于局部图像描述子的监督分级稀疏编码模型。
通过back-projection方法，以最小化在图像层级特征(image level features)的分类误差训练监督词典。其中图像层级特征是以空间金字塔为结构max pooling稀疏编码。在多种空间尺度下max pooling方法具有平移不变的特性，如同CNN(Convolutional Neural Network)一样。
实验证明，与无监督词典相比，监督词典明显地改善了模型的性能，并且在多个图像数据库拥有最好的表现。
另外，监督模型目标是学习线性特征，它蕴含了一个巨大潜能-实时地处理大规模数据库

拟解决的问题

lImage classification

ØTo find a generic feature representation

ØInterested in linear prediction model

以前的方法

Histogram-based SPM feature

ØStep 1: local descriptor extraction

ØStep 2:vector quantization (e.g.k-means)

ØStep 3:hierarchical average pooling

ØStep 4:nonlinear SVM

本文的方法

The framework of ScSPM（CVPR09）

ØStep 1: local descriptor extraction

ØStep 2:sparse coding (无监督词典)

ØStep 3:hierarchical max pooling(提取最大的稀疏系数)

ØStep 4:linear SVM

相关知识（1）：

稀疏表示&取稀疏系数的最大值

分级融合模型：

本文Model（1）：

求解方法1：

：Squared hinge loss function

：Only cares about the pooled maximum values

：Linear prediction model

：No analytical link，其中：

求解方法2：

简短描述blog: http://www.cnblogs.com/sunshy/archive/2011/08/26/2155126.html

文章主页包含代码下载： http://www.ifp.illinois.edu/~jyang29/ScSPM.htm

小熊不去实验室

博客等级

码龄16年

176
原创

472
点赞

987
收藏

2634
粉丝

关注

私信

热门文章

分类专栏

图像滤镜 15篇
学习OpenCV 71篇
OpenCV 81篇
计算机视觉 39篇
机器学习 26篇
特征篇 11篇
matlab 5篇
算法 46篇
C++ 25篇
基本 19篇
杂谈 20篇
Qt 3篇
数据库 2篇
Kinect 16篇
OpenGL 6篇
Ogre 3篇
计算机图形学 11篇
笔试面试 4篇
滤镜 15篇
shader 5篇
Leap 1篇
Unity 1篇
CUDA 2篇
并行计算
UDK 3篇
Cinder 1篇

最新评论

学习Cinder——建立Cinder工程
CSDN-Ada助手: 非常感谢CSDN博主的分享，关于建立Cinder工程的文章非常实用。我认为接下来可以继续写一篇关于Cinder中图形渲染的技术文章，介绍如何利用Cinder实现各种图形效果，对于正在学习Cinder的读者会非常有帮助。相信会有更多读者受益于你的分享。期待你的下一篇文章！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
CUDA 与 OpenCL 区别
森头: 也就是说OpenCL是接口，cuda是实现。而且cuda还实现了其他接口，比如DirectX。就像面向对象中一个类实现了多个接口。请问是这样吗？
OpenCV码源笔记——RandomTrees (一)
遥感真难: 请问一下您参数选择是否有什么规范或者是标准呢？
学习OpenCV：滤镜系列（11）——高反差保留（6.30修改版）
王二小、: 请问一下，r=(pix[x,y]-avg(R))/128，这个公式是什么意思， pix是什么， R是什么谢谢
一个华科研究生导师的肺腑之言（主要适用于理工科）
sdfkjlkewjkcz: 老师的话真让人受益匪浅，抵制外界诱惑、抛掉低级趣味、找到自己真正热爱的事情并坚持做下去，这对每个人来说都是莫大的挑战。

大家在看

最新文章

目录

评论 8

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。