什么是NMF模型?
NMF = Non-negative Matrix Factorization.
V= WH
V, W , H 三个矩阵里的值都大于等于0.
NMF 的目的就是将矩阵V分解为较小的两个矩阵H和W。
我们把 V 称为Visible units , H 称作为 Hidden units, W 为 weights . V 通过 W 连接到H. H 被称为Hidden Factor, latent variables 或者basis.
NMF 可以用来降维 或者 聚类。 在此文中,我们将把NMF模型应用到市场数据中,进行聚类分析。 这种聚类一般被称为 双聚类 biclustering .
我们的数据:
我们将使用 R package "bayesm" 中 的Scotch 数据
library(bayesm)
data(Scotch)
以下是Raw data:
Chivas.Regal Dewar.s.White.Label Johnnie.Walker.Black.Label J...B
1 1 0 0 0
2 0 0 1 0
3 0 0 0 0
4 1 0 1 0
5 1 0 1 0
6 0 0 0 0
7 0 0 0 0
8 0 1 0 1
|
#
|
Symbol
|
Brand
|
# Users
|
Price
|
Bottled
|
Type
|
1
|
CHR
|
Chivas Regal
|
806
|
21.99
|
Abroad
|
Blend
|
2
|
DWL
|
Dewar’s White Label
|
517
|
17.99
|
Abroad
|