![290c19df10bd3bb1a84f36801bc1e948.png](https://img-blog.csdnimg.cn/img_convert/290c19df10bd3bb1a84f36801bc1e948.png)
()1.K-mean算法简述
K-均值是最普及的聚类算法,算法接受一个未标记的数据集,然后将数据聚类成不同的组。
K-均值是一个迭代算法,假设我们想要将数据聚类成 n 个组,其方法为:
- 首先选择 个随机的点,称为聚类中心(cluster centroids)
- 对于数据集中的每一个数据,按照距离 个中心点的距离,将其与距离最近的中心点关联起来,与同一个中心点关联的所有点聚成一类。
- 计算每一个组的平均值,将该组所关联的中心点移动到平均值的位置。
- 重复步骤 2-4 直至中心点不再变化。
下面是一个聚类示例:
![f8bc7bb27beb1ae5a88f185f0296b328.png](https://img-blog.csdnimg.cn/img_convert/f8bc7bb27beb1ae5a88f185f0296b328.png)
![4c44d98a01a88452c6b10bbef7736f7f.png](https://img-blog.csdnimg.cn/img_convert/4c44d98a01a88452c6b10bbef7736f7f.png)
![592a197f19e7752ef940ddd9e643de70.png](https://img-blog.csdnimg.cn/img_convert/592a197f19e7752ef940ddd9e643de70.png)
用
![56cc36115de46742e5bff80532c6dba2.png](https://img-blog.csdnimg.cn/img_convert/56cc36115de46742e5bff80532c6dba2.png)
算法分为两