实验名称
算法-K-Means的使用
实验目的
实验原理
(1)K-Means
选择K个点作为初始质心
repeat
将每个点指派到最近的质心,形成K个簇
重新计算每个簇的质心
until 簇不发生变化或达到最大迭代次数。
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/3733114b971f01e7edac033a38bb074f.png)
实验环境
- VMware Workstation
- Ubuntu 16.04
- Pycharm
- Pyspark
实验步骤
from pyspark.ml.clustering import KMeans
from pyspark.ml.evaluation import ClusteringEvaluator