非监督HMP算法的物体识别

原文Unsupervised Feature Learing for RGB-D Based Object Recognition

应该算是花了比较长时间来看的一篇论文,理解起来也相较容易,而且最近看的论文大都也是使用的K-SVD算法进行编码,得到的效果十分不错。

使用HMP对RGB-D图像进行图像识别,特点无监督学习特征,使用HMP(hierarchical matching pursuit)进行特征表示
HMP使用稀疏编码,直接从RGB-D数据中进行无监督学习分层特征表示
学习过程中采用K-SVD算法对特征进行编码,并且特征采用分层的方式,使用正交匹配跟踪(orthogonal matching pursuit)以及空间金字塔池化进行学习。
使用核描述符学习patch级特征,对照人工设计的像素描述符,如梯度等进行设计实现。随后使用K-SVD算法对特征
使用空间编码对学到的特征进行表示,使用基于特征学习的K-SVD对RGB-D图像进行表示。
非监督特征学习
-首先使用K-SVD进行字典学习,例,对于一块5*5像素的RGB-D patch而言,字典所包括的向量大小为5*5*8,其中8的大小是由灰度强度,RGB,深度以及表面法向量值决定的。
-使用正交匹配追踪计算空间编码矩阵,在上一步中实现了dict,下面对每一个xn(对应字典矩阵中的每一列)都使用OMP进行迭代计算,在每步迭代过程中,OMP选择codeword dm,使得能够最佳匹配当前剩余的,也就是说在选择当前codeword后,重建后错误仍能够保持。
-使用单值分解(Singular Value Decomposition,SVD)更新字典,在第m步中,第m个codeword以及它的空间编码能够通过对剩余的这个codeword的相关矩阵使用SVD计算实现。
在分层匹配追踪中,使用K-SVD学习字典,第一层提取patches,第二层是对第一层空间编码的池化。第一层学习的特征有灰度,RGB,深度以及深度图像的表面法向量。一旦完成通过K-SVD学习的字典,稀疏编码就可以用于计算新的图像。

-分层匹配追踪(HMP),通过学习到的字典D,分层匹配追踪建立了一个特征层级,通过递归使用正交匹配追踪编码器实现。编码器由三个模块组成,包括batch 正交匹配追踪,金字塔最大池化,以及对比度归一化。
在分层匹配追踪过程中,在第一层,稀疏编码在每个像素上都进行计算,随后进行空间金字塔最大池化以进入特征向量,表示一个16*16的patch;第二层使用从采样patch级别的特征向量字典对这些特征向量进行编码。整幅图片的特征使用第一层和第二层的稀疏编码进行表示。
        稀疏编码计算每个像素点--->使用空间金字塔最大池化变为特征向量A--->进入第二层,使用patch级的特征向量字典对这些特征向量再进行编码B
最终图片的特征就由特征向量A和特征向量B共同表示


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值