【1】http://f.dataguru.cn/thread-460065-1-1.html
【2】聚类确实是将相似的样本归为一类,使同类样本相似度尽可能高,异类的相似性尽可能低。..
【3】谱聚类:是采用图的思想。样本点作为图中的点,边为样本点之间的相似度。
所以谱聚类就是想去边,去掉边的权重尽量小,即异类样本间尽量不同;子图内边的权重尽量大,同类样本尽可能相似。
【n】知识点:
核函数的理解:就是高维空间中的两个参数的内积。
高斯核中的带宽是人为设定的参数。可用高斯核函数来衡量相似性
拉普拉斯矩阵详情见上链接,注意性质。