机器学习sklearn-聚类

sklearn中聚类算法有两种表现形式,一种是类,需要实例化,然后训练并调动接口,另一种是函数,输入特征矩阵和超参数就可得到结果。

k-means 聚类算法的典型代表

将一组n个样本的特征矩阵X划分为K个无交集的簇,直观上来看簇是一组聚集的数据,在一个簇中的数据认为同一类。

簇中所有数据的均值被称为这个簇的质心。

簇的个数K是一个超参数,需要人为输入来确定,kmeans的核心人物就是根据我们设定好的K找出K个最优质心,并将离这些质心最近的数据分别分配到这些质心代表的簇中。

簇内差异:样本点到其所在簇的质心的距离

簇内平方和 整体平方和,越小表示聚类效果越好,kmeans求解过程为一个最优化问题

可以把这个看做是kmeans的损失函数,但并不严谨,更像模型评估指标

sklearn中只能使用欧氏距离 曼哈顿距离和余弦距离不能用

kmeans算法时间复杂度,最快的聚类算法

计算成本很大 时间复杂度很大

 sklearn.cluster.KMeans

重要参数n_clusters 是参数K,模型要分为几个簇  唯一的必填参数

有随机性参数 random_state=0

属性labels_ 查看聚好的类别,每

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值