K-means

代价函数 

定义:即每个样本到它所属类的聚类中心的距离平方和再除以m:

本质就是为了代价函数最小从而推出的算法。

步骤

1.随机选择K个聚类中心(可以随机选择k个样本点作为聚类中心),离聚类中心近的样本点被归为一类 

公式表达:(i=1,2..m,Ci表示第i个样本所在的类的索引是多少)

聚类中心k的坐标记为:

 

2、计算各个类各自的均值点,然后把聚类中心移动到那里

3.重新根据聚类中心进行归类,离得近的归为一类,接着重复上面的步骤,最后停下来时计算代价函数。

4.由于可能出现局部最优的情况,所以需要开始第二次循环:再次随机初始化聚类中心,重复以上步骤,最终计算代价函数 。。。。。最后循环大约100次左右,选择代价函数最小的那一次的结果作为最终的结果。

 K值的确定

①肘部法则(elbow method)

画出代价函数随着K的变化曲线,曲线中像肘部的那个点就可以确定最佳的K值了,不过有时候不像肘部,就得换个方法了。

②根据实际需要

转载于:https://www.cnblogs.com/pjishu/p/10826420.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值