关于KMeans的文档
from sklearn.cluster import KMeans
help(KMeans)
K-Means clustering
KMeans聚类
参数:
n_clusters: int类型,默认8。产生的聚类数。
init: { 'k-means++', 'random' or an ndarray}, 默认k-means++。初始选取聚类中心位置的方法。
'k-means++' :kmeans聚类法中一种选择初始聚类中心的方法,可以加速收敛。
'ransom' : 随机选择k个中心。
当使用nadarry形式时,其形状应该是(n_clusters, n_features) 给出聚类中心。
n_init: int类型,默认10。在不同的中心时运行kmeans的次数。
max_iter: int类型,默认300。kmeans算法单词运行中的最大迭代次数。
tol: float类型,默认1e-4。相对误差。
precompute_distances: {'auto', Ture, False}。预计算距离(更快,但占用更多内存)
‘auto’:当n_samples * n_clusters >12000000 时不预计算距离。
True:一直预计算距离
False:不预计算距