nmf算法 python_NMF算法简介及python实现-CSDN博客

本文链接：https://blog.csdn.net/weixin_30052271/article/details/114353527

非负矩阵分解（NMF）是一种将大型矩阵分解为两个小型非负矩阵的技术，常用于数据降维和推荐系统。本文介绍了NMF的基本原理、数学基础、Python实现以及在协同过滤预测评分中的应用。通过矩阵分解，可以发现用户和电影之间的潜在特征，用于预测用户对未评分电影的评分。

摘要由CSDN通过智能技术生成

[ pca算法用于原始数据维数较高时对数据进行降维关于pca算法的学习，有一篇分析特别详细的论文http://www.cs.otago.ac.nz/cosc453/student_tutorials/principal_componen

基本原理

NMF，非负矩阵分解，它的目标很明确，就是将大矩阵分解成两个小矩阵，使得这两个小矩阵相乘后能够还原到大矩阵。而非负表示分解的矩阵都不包含负值。从应用的角度来说，矩阵分解能够用于发现两种实体间的潜在特征，一个最常见的应用就是协同过滤中的预测打分值，而从协同过滤的这个角度来说，非负也很容易理解：打分都是正的，不会出现负值。

在例如Netflix或MovieLens这样的推荐系统中，有用户和电影两个集合。给出每个用户对部分电影的打分，我们希望预测该用户对其他没看过电影的打分值，这样可以根据打分值为其做出推荐。用户和电影的关系，可以用一个矩阵来表示，每一行表示用户，每一列表示电影，每个元素的值表示用户对已经看过的电影的打分，矩阵看起来如下：

U1 5 3 - 1

U2 4 - - 1

U3 1 1 - 5

U4 1 - - 4

U5 - 1 5 4

而使用矩阵分解来预测评分的思想来源于，我们可以通过矩阵分解来发现一些用户打分的潜在特征。比如两个人都喜欢某一演员，那他们就倾向于给TA演的电影打高分；或者两个人都喜欢动作片。假如我们能够发现这些特征，我们就能够预测特定用户对特定电影的打分。

为了发现不同的特征，我们假设特征的数量少于用户和电影的数量