聚类-理论补充2

文章介绍了拉普拉斯矩阵的不同形式,包括未正则、随机游走和对称拉普拉斯矩阵,并详细阐述了它们在谱聚类算法中的应用,用于数据点的聚类。通过计算特征向量并使用k-means算法进行聚类。此外,还提及了随机游走与拉普拉斯矩阵的关系以及标签传递算法在半监督学习中的作用。
摘要由CSDN通过智能技术生成

目录

一。拉普拉斯矩阵的定义

二。谱聚类算法:未正则拉普拉斯矩阵 

三。谱聚类算法:随机游走拉普拉斯矩阵

四。谱聚类算法:对称拉普拉斯矩阵

五。进一步思考

 六。随机游走和拉普拉斯矩阵的关系

 七。标签传递算法


一。拉普拉斯矩阵的定义

计算点之间的邻接相似度矩阵W

        若两个点的相似度值越大,表示这两个点越相似;
        同时,定义wij=0表示vi,vj两个点没有任何相似性(无穷远) 

W的第i行元素的和为vi的度。形成顶点度对角阵D

        dii表示第i个点的度
        除主对角线元素,D其他位臵为0

未正则的拉普拉斯矩阵:L=D-W

正则拉普拉斯矩阵

二。谱聚类算法:未正则拉普拉斯矩阵 

输入:n个点{pi},簇的数目k

        计算n×n的相似度矩阵W和度矩阵D;
        计算拉普拉斯矩阵L=D-W;
        计算L的前k个特征向量u1,u2,...,uk;
        将k个列向量u1,u2,...,uk组成矩阵U,U∈Rn×k;
        对于i=1,2,...,n,令yi∈Rk是U的第i行的向量;
        使用k-means算法将点(yi)i=1,2,...,n聚类成簇C1,C2,...Ck;
        输出簇A1,A2,...Ak,其中,Ai={j|yj∈Ci}

三。谱聚类算法:随机游走拉普拉斯矩阵

输入:n个点{pi},簇的数目k

        计算n×n的相似度矩阵W和度矩阵D;
        计算正则拉普拉斯矩阵Lrw=D-1(D-W);
        计算Lrw的前k个特征向量u1,u2,...,uk;
        将k个列向量u1,u2,...,uk组成矩阵U,U∈ Rn×k ;
        对于i=1,2,...,n,令yi∈Rk是U的第i行的向量;
        使用k-means算法将点(yi)i=1,2,...,n聚类成簇C1,C2,...Ck ;
        输出簇A1,A2,...Ak,其中,Ai={j|yj∈Ci}

四。谱聚类算法:对称拉普拉斯矩阵

输入:n个点{pi},簇的数目k
        计算n×n的相似度矩阵W和度矩阵D;
        计算正则拉普拉斯矩阵Lsym=D-1/2(D-W) D-1/2;
        计算Lsym的前k个特征向量u1,u2,...,uk;
        将k个列向量u1,u2,...,uk组成矩阵U,U∈Rn×k;
        对于i=1,2,...,n,令yi∈Rk是U的第i行的向量;
        对于i=1,2,...,n,将yi∈Rk依次单位化,使得|yi|=1;
        使用k-means算法将点(yi)i=1,2,...,n聚类成簇C1,C2,...Ck;
        输出簇A1,A2,...Ak,其中,Ai={j|yj∈Ci}

五。进一步思考

 六。随机游走和拉普拉斯矩阵的关系

图论中的随机游走是一个随机过程,它从一个顶点跳转到另外一个顶点。谱聚类即找到图的一个划分,使得随机游走在相同的簇中停留而几乎不会游走到其他簇。

 七。标签传递算法

对于部分样本的标记给定,而大多数样本的标记未知的情形,是半监督学习问题。

标签传递算法(Label Propagation Algorithm,LPA),将标记样本的标记通过一定的概率传递给未标记样本,直到最终收敛。

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

PURE-li

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值