【机器学习】K-Means 聚类是特殊的矩阵分解问题

【机器学习】K-Means 聚类是特殊的矩阵分解(Matrix Factorization)问题


原文是:《k-Means Clustering Is Matrix Factorization》

本博客是该论文的阅读笔记,不免有很多细节不对之处。

还望各位看官能够见谅,欢迎批评指正。

更多相关博客请猛戳:http://blog.csdn.net/cyh_24

如需转载,请附上本文链接:http://blog.csdn.net/cyh_24/article/details/50408884

论文证明了传统的K-Means算法的目标函数可以被表达成数据矩阵与其低阶数据矩阵之间差异的Frobenius范数。

简要的说,K-Means 聚类其实是一种矩阵分解问题。

K-Means的推导,我想大家都已经很清楚了,这里不细说。它的目标函数,可以定义如下:

i=1kj=1nzij||xjμi||2

如果能够把目标函数表达成如下形式,那么也就证明了K-Means聚类是特殊的矩阵分解问题。

?=||XMZ||2
?=||XXZT(ZZT)1Z||2

先不用深究,下文会详细介绍,先注意几个变量的意义:
数据集 XRmn 是向量 xiRm 的矩阵;
MRmk ,是类中心点 μiRm 的矩阵;
ZRkn ,是二值指示变量 zij 的矩阵;若 xjCi ,则 zij=1 ,否则 zij=0

数学符号说明

  1. xi 表示矩阵 X 的第 j-th列向量(好像与平常的相反了);
  2. X 的第(l,j)的元素可以写成 xlj 或者 (X)lj
  3. ||x|| 表示欧式距离,
  4. ||X|| 则表示矩阵的 Frobenius 范数
  5. 其Frobenius 范数平方形式定义如下:
    ||X||2=l,jx2lj=j||xj||2=jxTjxj=j(XTX)jj=tr[XTX]

推导过程

假设,数据集 X 可以分成 k 个类 C1,...Ck , 分别对应的类中心点是 μ1,...μk
zij 是二值指示变量:若 xjCi ,则 zij=1 ,否则 zij=0
那么,显然可以得到:

izij=1

而每行总和刚好是这个类中的样本个数:

jzij=ni=|Ci|

由于 zji{0,1} ,所以 Z 的每一列只有一个1,所以:

zijzij=1(i=i)or0otherwise

因此, ZZT 是一个对角矩阵,并且:

(ZZT)ii=j(Z)ij(ZT)ji=jzijzij
=ni,ifi=i
=0,otherwise

Step 1: 将目标函数左边展开

此处输入图片的描述

Step 2: 将目标函数中间项展开

接下来,我们看目标函数的中间项。作为矩阵Frobenius范数的平方,它可以按如下方式写:
此处输入图片的描述

从之前的结论中,我们可以快速发现: T1=T4andT2=T5 . 所以,只要 T3=T6 ,那么我们假设的目标函数的第一个等式就成立了。所以,现在的目标就是证明 T3=T6 .
来看一下 T6 ,可以得到:

tr[ZTMTMZ]=tr[MTMZZT]

=i(MTMZZT)ii

=il(MTM)il(ZZT)li

=i(MTM)ii(ZZT)ii

=i||μi||2ni

在上面的推导中,我们用到了 ZZT 是对角阵的特性。到此, T3=T6 证明完毕,因此,目标函数的第一个等式也就证明完毕了。

Step 3: 消除矩阵 M

现在的任务就是证明第二个等式。
回顾一下我们的目的,就是讲目标函数最小化, 因为已经证明了第一个等式,所以,其实也就是让||XMZ||2 最小化:

δδM||XMZ||2
=δδM[tr[XTX]2tr[XTMZ]+tr[ZTMTMZ]]
=2(MZZTXZT)

令偏导等于0,可以得到:

M=XZT(ZZT)1

代入目标函数第二个等式,就证明完毕了。

结论

我们在上面用了一大堆令人眩晕的代数表达式,终于说明了K-Means聚类问题可以被理解成是如下的受约束的矩阵分解问题:

i=1kj=1nzij||xjμi||2minZ||XXZT(ZZT)Z||2

s.t.zij{0,1}

jzij=1

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值