1、聚类算法
无监督学习算法,用于将相似的样本自动归到一个类别中。
在聚类算法中根据样本之间的相似性,将样本划分到不同的类别中。
2、k-means api
model=sklearn.cluster.KMeans(n_clusters=k)
model.fit(x)
model.predict(x)
model.fit_predict(x)
- n_clusters:开始的聚类中心数量
2.1 步骤思路
- 随机选取K个点作为初始的聚类中心
- 计算其他每个点到K个中心的距离,未知的点选择最近的一个聚类中心点作为标记类别
- 重新计算出每个聚类的新中心点(平均值)
- 如果计算得出的新中心点与原中心点一样,那么结束,否则重新进行第二步过程
3、解决非线性的分类情况
import numpy as np
import matplotlib.pyplot as plt
import