一、KMeans算法损失函数
该loss公式无法直接求解,需要使用迭代的方式。
二、Kmeans算法流程
第一阶段
第二阶段
KMeans算法注意点:
- 最后的聚类结果高度依赖于初始均值向量的选择
- 比较适合连续属性的特征向量聚类
代码如下:
from math import sqrt
from random import randint
class Cluster(object):
def __init__(self):
#簇的所有特征向量
self._fcs=[]
#簇的中心点
self._center=None
def set_center(self,new_center):
self._center=new_center
def get_center(self):
return self._center
def add_fc(self,fc):
self._fcs.append(fc)
def update_center(self):
#更新中心点
#特征向量中特征的数量