非监督HMP算法的物体识别

最新推荐文章于 2021-01-09 15:36:56 发布

Beryl已存在

最新推荐文章于 2021-01-09 15:36:56 发布

阅读量627

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Miss_yan/article/details/78409562

版权

原文Unsupervised Feature Learing for RGB-D Based Object Recognition

应该算是花了比较长时间来看的一篇论文，理解起来也相较容易，而且最近看的论文大都也是使用的K-SVD算法进行编码，得到的效果十分不错。

使用HMP对RGB-D图像进行图像识别，特点无监督学习特征，使用HMP（hierarchical matching pursuit）进行特征表示

HMP使用稀疏编码，直接从RGB-D数据中进行无监督学习分层特征表示

学习过程中采用K-SVD算法对特征进行编码，并且特征采用分层的方式，使用正交匹配跟踪（orthogonal matching pursuit）以及空间金字塔池化进行学习。

使用核描述符学习patch级特征，对照人工设计的像素描述符，如梯度等进行设计实现。随后使用K-SVD算法对特征

使用空间编码对学到的特征进行表示，使用基于特征学习的K-SVD对RGB-D图像进行表示。

非监督特征学习

-首先使用K-SVD进行字典学习，例，对于一块5*5像素的RGB-D patch而言，字典所包括的向量大小为5*5*8，其中8的大小是由灰度强度，RGB，深度以及表面法向量值决定的。

-使用正交匹配追踪计算空间编码矩阵，在上一步中实现了dict，下面对每一个xn（对应字典矩阵中的每一列）都使用OMP进行迭代计算，在每步迭代过程中，OMP选择codeword dm，使得能够最佳匹配当前剩余的，也就是说在选择当前codeword后，重建后错误仍能够保持。

-使用单值分解（Singular Value Decomposition，SVD）更新字典，在第m步中，第m个codeword以及它的空间编码能够通过对剩余的这个codeword的相关矩阵使用SVD计算实现。

在分层匹配追踪中，使用K-SVD学习字典，第一层提取patches，第二层是对第一层空间编码的池化。第一层学习的特征有灰度，RGB，深度以及深度图像的表面法向量。一旦完成通过K-SVD学习的字典，稀疏编码就可以用于计算新的图像。

-分层匹配追踪（HMP），通过学习到的字典D，分层匹配追踪建立了一个特征层级，通过递归使用正交匹配追踪编码器实现。编码器由三个模块组成，包括batch 正交匹配追踪，金字塔最大池化，以及对比度归一化。

在分层匹配追踪过程中，在第一层，稀疏编码在每个像素上都进行计算，随后进行空间金字塔最大池化以进入特征向量，表示一个16*16的patch；第二层使用从采样patch级别的特征向量字典对这些特征向量进行编码。整幅图片的特征使用第一层和第二层的稀疏编码进行表示。

稀疏编码计算每个像素点--->使用空间金字塔最大池化变为特征向量A--->进入第二层，使用patch级的特征向量字典对这些特征向量再进行编码B

最终图片的特征就由特征向量A和特征向量B共同表示

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。