Kmeans算法概述

1.Kmaens是做什么的?在什么方面有应用?
Kmeans是聚类算法的一种,在工业界应用广泛,简单效果好,ps:企业拥有大数据量可以弥补Kmeans算法过于简单的性能劣势。
而复杂、高端的算法运行成本过高,企业用的略少。
2.其它聚类算法:Kmeans、EM算法、Mean Shift、谱聚类、层次聚类
3.Kmeans算法流程:

4.图解说明Kmeans:
数据


step1

step2

step3

step4

step5

step6

step7

step8


5.Kmeans缺点:

具有贪心算法特性,因此不是全局最优点。

6.影响算法的因素:

①类中心K的选取,k=3?k=4?

②初始点选取。ps:比K的选取重要。


①实验结果表明:Kmeans++的效果最好

②Kmeans++中为什么最远的点以某个概率选择?而不是直接选取最远的点?

因为:最远的点可能是离群点(异常值),不是很代表性的值










































































































  • 7
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值