字典学习（Dictionary Learning, KSVD）详解

最新推荐文章于 2024-07-27 15:39:54 发布

weixin_30307267

最新推荐文章于 2024-07-27 15:39:54 发布

阅读量5.2k

点赞数 8

文章标签： python 人工智能开发工具

原文链接：http://www.cnblogs.com/endlesscoding/p/10090866.html

版权

本文深入探讨字典学习的思想，通过数学模型和优化问题的描述，解释了字典学习如何用于数据降维。介绍了KSVD算法的详细步骤，包括稀疏编码、字典更新和Python实现，并提供了算法的伪代码。最后，文章提到了在Python环境中应用字典学习的关键点。

摘要由CSDN通过智能技术生成

注：字典学习也是一种数据降维的方法，这里我用到SVD的知识，对SVD不太理解的地方，可以看看这篇博客：《SVD（奇异值分解）小结》。

1、字典学习思想

字典学习的思想应该源来实际生活中的字典的概念。字典是前辈们学习总结的精华，当我们需要学习新的知识的时候，不必与先辈们一样去学习先辈们所有学习过的知识，我们可以参考先辈们给我们总结的字典，通过查阅这些字典，我们可以大致学会到这些知识。

为了将上述过程用准确的数学语言描述出来，我们需要将“总结字典”、“查阅字典”做出一个更为准确的描述。就从我们的常识出发：

我们通常会要求的我们的字典尽可能全面，也就是说总结出的字典不能漏下关键的知识点。
查字典的时候，我们想要我们查字典的过程尽可能简洁，迅速，准确。即，查字典要快、准、狠。
查到的结果，要尽可能地还原出原来知识。当然，如果要完全还原出来，那么这个字典和查字典的方法会变得非常复杂，所以我们只需要尽可能地还原出原知识点即可。

注：以上内容，完全是自己的理解，如有不当之处，欢迎各位拍砖。

下面，我们要讨论的就是如何将上述问题抽象成一个数学问题，并解决这个问题。

2、字典学习数学模型

2.1 数学描述

我们将上面的所提到的关键点用几个数学符号表示一下：

“以前的知识”，更专业一点，我们称之为原始样本，用矩阵\(\mathbf{Y}\)表示；
“字典”，我们称之为字典矩阵，用\(\mathbf{D}\)表示，“字典”中的词条，我们称之为原子（atom），用列向量\(\mathbf{d}_k\)表示；
“查字典的方法”，我们称为稀疏矩阵，用\(\mathbf{X}\)；
“查字典的过程”，我们可以用矩阵的乘法来表示，即\(\mathbf{DX}\)。

用数学语言描述，字典学习的主要思想是，利用包含\(K\)个原子\(\mathbf{d}_k\)的字典矩阵\(\mathbf{D}\in \mathbf{R}^{m \times K}\)，稀疏线性表示原始样本\(\mathbf{Y} \in \mathbf{R}^{m \times n}\)（其中\(m\)表示样本数，\(n\)表示样本的属性），即有\(\mathbf{Y=DX}\)（这只是我们理想的情况），其中\(\mathbf{X} \in \mathbf{R}^{K \times n}\)为稀疏矩阵，可以将上述问题用数学语言描述为如下优化问题

\[ \min_{\mathbf{D,\ X}}{

最低0.47元/天解锁文章

weixin_30307267

关注

8
点赞
踩
104

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。