NMF 非负矩阵分解(Non-negative Matrix Factorization)实践

最新推荐文章于 2025-05-29 16:48:54 发布

原创

最新推荐文章于 2025-05-29 16:48:54 发布 · 1.9w 阅读

89 ·

CC 4.0 BY-SA版权

文章标签：

#NMF #非负矩阵分解 #推荐算法

本文介绍了如何使用NMF（非负矩阵分解）实现推荐算法。通过Python的sklearn库，展示了NMF如何对用户评分矩阵进行分解，并通过分析分解后的矩阵进行电影主题划分和用户群体划分。推荐部分阐述了如何基于NMF结果进行推荐，并讨论了NMF与SVD、ALS等其他推荐算法的差异和适用场景。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. NMF-based 推荐算法

在例如Netflix或MovieLens这样的推荐系统中，有用户和电影两个集合。给出每个用户对部分电影的打分，希望预测该用户对其他没看过电影的打分值，这样可以根据打分值为其做出推荐。用户和电影的关系，可以用一个矩阵来表示，每一列表示用户，每一行表示电影，每个元素的值表示用户对已经看过的电影的打分。下面来简单介绍一下基于NMF的推荐算法。

在python当中有一个包叫做sklearn，专门用来做机器学习，各种大神的实现算法都在里面。本文使用

from sklearn.decomposition import NMF

数据

电影的名称，使用10个电影作为例子：

item = [
    '希特勒回来了', '死侍', '房间', '龙虾', '大空头',
    '极盗者', '裁缝', '八恶人', '实习生', '间谍之桥',
]

用户名称，使用15个用户作为例子：

user = ['五柳君', '帕格尼六', '木村静香', 'WTF', 'airyyouth',
        '橙子c', '秋月白', 'clavin_kong', 'olit', 'You_某人',
        '凛冬将至', 'Rusty', '噢！你看！', 'Aron', 'ErDong Chen']

用户评分矩阵：

RATE_MATRIX = np.array(
    [[5, 5, 3, 0, 5, 5, 4, 3, 2, 1, 4, 1, 3, 4, 5],
     [5, 0, 4, 0, 4, 4, 3, 2, 1, 2, 4, 4, 3, 4, 0],
     [0, 3, 0, 5, 4, 5, 0, 4, 4, 5, 3, 0, 0, 0, 0],
     [5, 4, 3, 3, 5, 5, 0, 1, 1, 3, 4, 5, 0, 2, 4],
     [5, 4, 3, 3, 5, 5, 3, 3, 3, 4, 5, 0