K - means cluster
1.K均值聚类(迭代算法):
3.优缺点:
- C_center:初始化K个聚类中心
- 计算样本集合到C_center的距离(本例使用欧几里德距离)
- 按照最近原则进行聚类,如果聚类中心不发生改变,结束
- 如果发生改变,得到新的聚类中心->C_center,重复直到收敛
3.优缺点:
- 算法简单,收敛
- 选出的每类代表可能并不具有代表性,算法需要进行多次迭代,把所有的数据读入内存中,大量数据可能不适用
4.样例:
训练样本很明显可以分为两类,红蓝点
X = [