谱聚类属于机器学习的一种算法
有几个地方还是不明白,自己写了代码,运行了,正确率降低了。
谱聚类可以用于特征选择来降低维数,‘抓住主要矛盾,忽略次要矛盾’
方法:1、求相似度矩阵即带权领接矩阵Sij:(1)K近邻矩阵,求得与i样本最近的K个样本的权,保存在矩阵中,与其余的样本的权都舍弃为0
(2)阈值,设定阈值下限,低于阈值的舍弃
第一种方法求得的不是对称矩阵,不知道对后续运算有没有影响。
2、拉普拉斯矩阵A-S,归一化拉普拉斯矩阵A^(-1/2)(A-S)A^(-1/2)
3、求矩阵L=A^(-1/2)*S*A^(-1/2)的K最大特征值对应的特征向量,形成矩阵Q。
4、对Q进行Kmeans运算
不明白的地方,关于离散值稀疏为连续数值的含义,以及谱分析法的物理意思都没有看懂
K>> [Q,V]=eigs(L,K);
K>> [IDX,C]=kmeans(Q,K);