一.Kmeans介绍
非监督学习,聚类算法
1.1 算法过程
设当前k=2
第一步:初始化中心点
第二步:遍历样本点和中心之间的距离,离蓝色中心点近,则分为蓝色类别,反之,归为红色
第三步:步骤二获得红蓝两个类别,再次寻找蓝色区域的中心点和红色区域的中心点
第四步:根据红蓝区域的中心点,再次计算距离近的样本点,离蓝色中心点近,则分为蓝色类别,反之,归为红色
第五步:重复步骤三和四
第六步:老中心点与新中心位置没有发生变化,则聚类结束
1.2 Kmeans的目标函数
k表示分成组的个数
Xi表示样本点
µ表示中心点
R表示Xi属于K类,如果Xi属于k类,则R=1,否则R=0;
此函数使用EM算法求解:
1.假设µ已知,即已知中心点,同时样本点已知,求距离最小值
2.假设R已知,即已知样本点属于某类,则寻找该类的中心点
然后对1,2进行迭代
1.3 额外说明
Q: Kmeans结果是否