Efficient Parameter-free Clustering Using First Neighbor Relations这篇论文提出了一个无需参数的聚类方法,对于大样本数据也适用,计算复杂度低。
如果j是i的第一个邻居or i是j的第一个邻居or i的第一个邻居就是j的第一个邻居,则A(i,j)为1,否则为0
这样形成一个对称稀疏邻接矩阵,通过矩阵形成一个有向图,边来表示A(i,j)=1
下图(b)红圈表示九个星球的第一邻居,黄圈表示邻居为同一个
上图(c)是完成第一次聚类的效果,接下来对每个聚类重新进行计算,通过求均值得到三个cluster center;把这三个center再进行聚类,直到最后形成一个聚类。最后只要把适合我们聚类数量的结果输出即可。