-
基本的步骤为:
-
step1:选定要聚类的类别数目k
-
step2:针对每个样本点,找到距离其最近的中心点,距离同一中心点最近的点为一个类,这样完成了一次聚类。
-
step3:针对每个类别中的样本点,计算这些样本点的中心点,当做该类的新的中心点,继续step2。
实际案例分析
from sklearn.cluster import KMeans
df= pd.read_csv(‘data.csv’)
df.head()
df.info()
df.isnull().sum()