机器学习-kmeans

 

1 手写kemeans 

流程: 优点: 容易,缺点: 会收敛到局部最小值,在大规模数据集上收敛慢。

 

手写代码:https://blog.csdn.net/qq_41424519/article/details/81740214

F:\桌面\RNA-seq1\leetcode\10-面试真题\6- 字节跳动-手写kmeans.py

2 k 如何确定:

t-sne可视化和手肘法,k值所决定的是在该聚类算法中,所要分配聚类的簇的多少,kmeans 算法对初始值敏感,相同的k,选的点不同,会影响算法的聚类效果和迭代次数。

1 计算出不同k 下算法的BIC和AIC值,BIC或AIC越小,选择该k 值,

2 使用Canopy 算法进行粗略的聚类,产生的簇的个数作为kmeans 算法的k 值

3 使用X-menas 方法结合BIC 准则取判定簇的个数,也就是k 值。

4 使用轮廓系数来确定,选择是系数较大对应的k 值

5 使用交叉验证来确定目标函数(距中心距离的平方差)变小的k 值

6 用层次聚类,可视化后认为地观察认为聚为几类。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值