@Nael Alsaleh,你可以用下面的方法运行K-Means:from sklearn.cluster import KMeans
import numpy as np
import matplotlib.pyplot as plt
X=np.load('Mistery.npy')
wx = []
for i in range(1, 11):
kmeans = KMeans(n_clusters = i, random_state = 0)
kmeans.fit(X)
wx.append(kmeans.inertia_)
plt.plot(range(1, 11), wx)
plt.xlabel('Number of clusters')
plt.ylabel('Variance Explained')
plt.show()
注意,X是一个numpy数组。这段代码将创建弯头曲线,在这里您可以选择完美数量的簇,在本例中为5-6个。在
如果您使用的是numpy,您将拥有一个数组:
^{pr2}$
你也可能在处理一个列表
^{3}$
需要转换为array:np.array(X),甚至是Pandas数据帧: