数据挖掘 - 集体智慧编程 - 寻找独立特征

本文介绍了非负矩阵分解(NMF)在数据挖掘中的应用,通过将文章矩阵分解为特征矩阵和权重矩阵,揭示数据集的潜在特征。NMF能帮助找出文章的重要主题和关键词,用于文本挖掘。
摘要由CSDN通过智能技术生成

集体智慧编程第十章寻找独立特征:在数据集未明显标注的情况下,寻找数据集的潜在特征,比如SVD分解U,V矩阵都存在隐空间。


1. NMF

从数据中提取重要特征的技术被称为非负矩阵分解(NMF)。

假设我们手上有一个对多篇文章进行单词计数信息统计的文章矩阵。我们将这个矩阵分解为两个更小的矩阵,使得二者相乘几乎完全等于原来的矩阵,这两个矩阵分别是特征矩阵和权重矩阵。假设原矩阵R(10 *1000) = M(10 *K) x N(K*1000)

1.1 NMF的特征矩阵

在特征矩阵中,每一行对应一个特征,每个单词对应一列。矩阵中的数字代表了某个单词相对于某个特征的重要程度。这里N矩阵即为特征矩阵

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值