sklearn机器学习：K-Means初始质心怎么放_kmeans 中通过画学习曲线确定最佳 random state-CSDN博客

本文链接：https://blog.csdn.net/gracejpw/article/details/102557043

K-Means聚类的初始质心选择至关重要，影响算法的收敛速度和结果质量。init参数允许指定初始化方式，如默认的"k-means++"，能有效避免局部最小值。random_state控制随机种子，确保可重复性。n_init参数设定运行次数，以选取最优结果。k-means++方法通过智能选择初始质心，通常能获得更优的聚类效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

重要参数init & random_state & n_init

在K-Means中有一个重要的环节，就是放置初始质心。

init

如果有足够的时间，K-means一定会收敛，但Inertia可能收敛到局部最小值。是否能够收敛到真正的最小值很大程度上取决于质心的初始化。init就
是用来帮助我们决定初始化方式的参数。

random_state

初始质心放置的位置不同，聚类的结果很可能也会不一样，一个好的质心选择可以让K-Means避免更多的计算，让算法收敛稳定且更快。在之前讲解初始质心的放置时，我们是使用”随机“的方法在样本点中抽取k个样本作为初始质心，这种方法显然不符合”稳定且更快“的需求。为此，我们可以使用
random_state参数来控制每次生成的初始质心都在相同位置，甚至可以画学习曲线来确定最优的random_state是哪个整数。

n_init

一个random_state对应一个质心随机初始化的随机数种子。如果不指定随机数种子，则sklearn中的KMeans并不会只选择一个随机模式扔出结果，而会在每个随机数种子下运行多次，并使用结果最好的一个随机数种子来作为初始质心。我们可以使用参数n_init来选择，每个随机数种子下运行的次数。这个参数不常用到，默认10次，如果我们希望运行的结果更加精确，可以增加这个参数n_init的值来增加每个随机数种子下运行的次数。
然而这种方法依然是基于随机性的。
为了优化选择初始质心的方法，2007年Arthur, David, and Sergei Vassilvit