聚类算法

本文详细介绍了K-means聚类算法的工作原理、实现流程和评估标准,包括误差平方和、轮廓系数和CH系数。同时,讨论了算法的优缺点,如对离群点敏感和依赖初始值。此外,还提到了特征降维的重要性,如皮尔逊和斯皮尔曼相关系数,以及主成分分析在数据压缩和降维中的应用。
摘要由CSDN通过智能技术生成

聚类:

分类算法回归算法属于监督学习

非监督学习(无监督学习)
数据集合:没有目标值

聚类算法:

特征值
根据样本的相似度,把样本聚成簇
使用不同的聚类准则(相似度指标),产生的聚类结果不同。

应用:
用户画像

图像分割(图像的RDB三元素不同来对图像进行聚类)

聚类算法api初步使用:
kmeans算法 k平均聚类算法

sklearn.cluster.KMeans(n_clusters=8)
.fit(x) --> 先去拿咱们所有的数据去根据相似度聚类
.predict(x) --> 然后在根据训练的结果得知聚类的结果
.fit_predict(x) --> 由于咱们的参数一致,则合并的偷懒方法

聚类算法实现流程

k-means 算法
k: 打算聚成的簇数(中心质点的数目)
means: 同一簇中的所有点到中心质点的距离的平均值(越小越好)

k-means聚类步骤:

1 样本之中随机选k个点当作是中心质点(k:聚类的簇数)
2 其他的所有点计算离哪个中心点近,就是这个中心点所代表的这一簇
3 根据每一簇的样本求出新的中心点
4 第2步第3步重复迭代,直到中心点不动为止(达到完美的聚类效果)

###模型评估
1 误差平方和

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值