无监督学习 - 非负矩阵分解（Non-negative Matrix Factorization，NMF）

草明

于 2024-01-23 04:30:00 发布

阅读量811

点赞数 12

分类专栏：数据结构与算法文章标签：学习矩阵线性代数机器学习人工智能

本文链接：https://blog.csdn.net/galoiszhou/article/details/135741765

版权

数据结构与算法专栏收录该内容

88 篇文章

订阅专栏

本文介绍了非负矩阵分解(NMF)的基本概念，展示了如何使用Python的scikit-learn库进行NMF的实现，包括数据准备、模型构建、训练和结果可视化。重点强调了NMF在处理非负数据和实际应用中的意义，如主题建模。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

什么是机器学习

非负矩阵分解（Non-negative Matrix Factorization，NMF）是一种无监督学习算法，用于将非负矩阵分解为两个或多个较低秩的非负矩阵的乘积。NMF 在文本挖掘、图像处理、音频分析等领域都有广泛的应用，特别适用于处理非负数据。

以下是一个使用 Python 中的 scikit-learn 库来实现 NMF 的简单教程。

步骤1: 导入库

import numpy as np
import matplotlib.pyplot as plt
from sklearn.decomposition import NMF

步骤2: 准备数据

# 生成模拟数据
np.random.seed(42)
X = np.abs(np.random.normal(loc=0, scale=1, size=(100, 50)))

步骤3: 构建和训练 NMF 模型

# 构建 NMF 模型
n_components = 3  # 指定分解的组件数目
nmf = NMF(n_components=n_components, init='random', random_state=42)

# 训练模型
W = nmf.fit_transform(X)  # W 矩阵
H = nmf.components_  # H 矩阵

步骤4: 可视化结果

# 可视化原始数据
plt.figure(figsize=(8, 4))
plt.subplot(1, 2, 1)
plt.imshow(X, cmap='viridis', aspect='auto')
plt.title('Original Data')

# 可视化 NMF 分解结果
plt.subplot(1, 2, 2)
plt.imshow(np.dot(W, H), cmap='viridis', aspect='auto')
plt.title('NMF Reconstruction')
plt.show()