【机器学习-聚类算法k-means】

zhangqw1013

于 2023-12-18 14:18:52 发布

阅读量980

点赞数 21

文章标签：机器学习算法聚类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhangqw1013/article/details/135055932

版权

文章目录

一、聚类学习算法实现
二、案例
- 1.引入库
- 2.程序代码
三、模型评估
四、算法优化
总结

一、聚类学习算法实现

随机设置K个特征空间内的点作为初始的聚类中心
对于其他每个点计算到K个中心点的距离（欧氏距离），未知的点选择最近的一个中心点作为标记类别
聚类完成之后，计算每个类别的中心点（平均值）
如果计算得出的新中心点与原中心点一样（质心不再移动），那么结束，否则重新进行第2步过程

二、案例

1.引入库

代码如下（示例）：

import matplotlib.pyplot as plt
from sklearn.datasets import make_blobs
from sklearn.cluster import KMeans
from sklearn.metrics import calinski_harabaz_score

2.程序代码

#创建数据集
# cluster_std 分布，值越大越分散
# n_features 几个特征
# centers 中心点
X,y = make_blobs(n_samples=100,n_features=2,centers=[[-1,-1],[0,0],[1,1],[2,2]],cluster_std=[0.4,0.1,0.1,0.1],random_state=1)
plt.scatter(X[:,0],X[:,1],c=y)
plt.show()
# 训练
# n_clusters 聚成几类
estimator = KMeans(n_clusters=4,random_state=2)
pre = estimator.fit_predict

最低0.47元/天解锁文章

博客等级

码龄5年

16
原创

149
点赞

210
收藏

98
粉丝

关注

私信

热门文章

上一篇：: 【Boosting深度学习算法】

下一篇：: 【Hadoop-HDFS分布式文件系统】

最新评论

【k8s-PV与PVC挂载外部目录】
CSDN-Ada助手: 恭喜您写完第15篇博客！标题为“【k8s-PV与PVC挂载外部目录】”的博文内容看起来非常有趣。您在这篇博客中详细介绍了k8s中PV与PVC挂载外部目录的方法，对读者来说一定非常有帮助。我非常欣赏您的持续创作精神，能够坚持写15篇博客是一项了不起的成就。希望您能继续保持这样的势头，为读者带来更多有价值的技术分享。在下一步的创作中，我建议您可以考虑探索更多与k8s相关的主题，比如容器编排、集群管理等方面的内容。这些主题相信也会吸引到更多的读者，同时也能够进一步提升您的技术水平。再次祝贺您取得的成就，并期待您未来的创作！谦虚地说，我相信您会在技术分享的道路上越走越远。
【系统学习Hive常用知识】
CSDN-Ada助手: 恭喜您写了第16篇博客，题目为【系统学习Hive常用知识】！您的持续创作精神令人钦佩。在这篇博客中，您对Hive常用知识进行了系统学习，这无疑为读者提供了宝贵的学习资源。接下来，我想给您提供一些建议，希望能对您的下一步创作有所帮助。既然您已经掌握了Hive常用知识，为何不考虑进一步拓展这个主题呢？您可以尝试深入探讨Hive在大数据领域的应用，或者分享一些实际案例，让读者更好地理解如何在实践中使用Hive技术。总之，希望您能继续保持创作的热情，不断提升自己的技术水平。期待您的下一篇博客！
【大数据-Flume】
CSDN-Ada助手: 恭喜您完成了第14篇博客“【大数据-Flume】”！您的持续创作精神令人钦佩。对于下一步的创作建议，我认为可以考虑深入探讨Flume在大数据处理中的实际应用案例，或者分享一些关于Flume的高级技巧和实用技术经验，这样能够更好地帮助读者理解和应用Flume。期待您的更多精彩内容，谢谢您的分享！
【Hadoop-快速理解MapReduce原理】
CSDN-Ada助手: 恭喜您写了第13篇博客，标题为“【Hadoop-快速理解MapReduce原理】”！您对MapReduce原理的深入理解让我受益匪浅。希望您能继续保持创作的热情，不断分享您的学习心得和经验。或许下一步可以考虑写一些实际案例或者应用场景，让读者更直观地了解MapReduce在实际项目中的应用。谢谢您的分享，期待您更多精彩的博客！
【Hadoop-HDFS分布式文件系统】
CSDN-Ada助手: 恭喜你写了第12篇博客！能够持续创作并分享有关Hadoop-HDFS分布式文件系统的知识真是令人钦佩。希望你能够继续深入探讨Hadoop-HDFS的相关内容，或者可以考虑扩展到其他与大数据处理相关的主题，让更多人受益。加油！

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。