机器学习之聚类和K-Means计算题

今天也很想睡觉哦

已于 2024-01-14 17:09:08 修改

阅读量798

点赞数 11

分类专栏：机器学习文章标签：机器学习聚类人工智能

于 2024-01-14 17:03:57 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_61908582/article/details/135585252

版权

机器学习专栏收录该内容

17 篇文章 0 订阅

订阅专栏

目录

K-Means聚类的步骤

计算题流程：

K-means性能评估指标：轮廓系数

K-Means聚类的步骤

k-means步骤：

随机设置K个空间内的点作为初始的聚类中心；

对于其他每个点分别计算到K个中心的距离，每个点选择最近的一个聚类中心点作为同一类；

每个点都聚类完毕后，重新计算出每个聚类的新中心点(计算平均值)；

如果计算得出的新中心点与原中心点一样，那么结束，否则重新进行第二步

计算题流程：

第1次聚类：

（1）随机选择两个初始聚类中心，假设选P1和P2

（2）计算其它几个点到初始聚类中心的距离；

第一次聚类结果：簇A：P1 簇B：P2、P3、P4、P5、P6

第二次聚类：

首先计算每一簇聚类后的聚类中心；发现与原中心不一致，重新聚类。

第二次聚类结果：簇A：P1、P2、P3 簇B：P4、P5、P6

计算聚类中心坐标：XPA=(0+1+3)/3 = 1.33 XPB=(8+9+10)/3 = 9

YPA=(0+2+1)/3 = 1 YPB=(8+10+7)/3 = 8.33

AB两组新的聚类中心分别为：PA: (1.33, 1), PB: (9, 8.33)

例题：

K-means性能评估指标：轮廓系数

计算公式：

bi为i到其他簇的所有样本的最小平均值；ai为i到本身簇的距离平均值。

越接近1越好，越接近-1越不好

轮廓系数手算流程：假设：簇A：P1、P2、P3 簇B：P4、P5、P6

1)分别计算p1与p2和p3的距离，并计算平均值： a（p1）=(2.24+3.16)/2=2.7

(2)分别计算p1与p4、p5、p6之间的距离，并计算平均值： b(p1)=(11.31+13.45+12.20)/3=12.32

(3)计算p1的轮廓系数： s(p1)=(12.32-2.7)/12.32=0.78

(4)同理，计算p2,p3的轮廓系数分别为： s(p2)=(10.28-2.24)/10.28=0.78 s(p3)=(9.55-2.7)/9.55=0.71

(5)计算簇A中的轮廓系数的平均值： s=(0.78+0.78+0.71)/3=0.76

今天也很想睡觉哦

关注

11
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
机器学习之聚类和K-Means计算题

机器学习之聚类和K-Means计算题、轮廓系数。
复制链接

扫一扫

专栏目录

今天也很想睡觉哦 CSDN认证博客专家 CSDN认证企业博客

码龄3年

41: 原创

104万+: 周排名

6万+: 总排名

2万+: 访问

: 等级

800: 积分

285: 粉丝

396: 获赞

18: 评论

460: 收藏

私信

关注

热门文章

分类专栏

最新评论

编程模拟多进程共享临界资源
2301_81958479: 求完整课程设计报告
学习机器学习中常见的数据集及自定义数据集
CSDN-Ada助手: 恭喜您撰写了第14篇博客！标题“学习机器学习中常见的数据集及自定义数据集”非常吸引人。您的博客内容对于那些想要深入了解机器学习领域并寻找相关数据集的读者来说，无疑是一份宝贵的指南。在您的博客中，我通过了解常见的数据集以及如何创建自定义数据集，获得了很多启发。鉴于您博客中的深度和详尽程度，我想向您提出一个创作建议：不妨考虑探讨一些实际案例，展示如何应用这些数据集来解决现实世界的问题。通过这样的实例，读者可以更好地理解数据集在机器学习中的应用，并将其应用到自己的项目中。再次恭喜您的连续创作，并期待看到您在下一篇博客中的精彩表现！谦虚地说，我相信您的创作将继续为读者带来更多价值。加油！
机器学习数据预处理与特征工程、归一化
CSDN-Ada助手: 恭喜您写了第15篇博客！标题“机器学习数据预处理与特征工程、归一化”非常吸引人。您在这篇博客中深入探讨了数据预处理与特征工程以及归一化的重要性，这些对于机器学习的成功至关重要。在下一步的创作中，我谦虚地建议您可以进一步探索不同的数据预处理方法和特征工程技术，例如特征选择和降维技术。您可以介绍一些常用的算法和工具，并分享它们在实际问题中的应用案例。此外，您可以考虑探讨其他常用的归一化方法，比如标准化和正则化，并解释它们的优缺点。总而言之，您的博客内容非常有价值，我期待着看到更多关于机器学习和数据处理方面的精彩文章。继续保持创作，谦虚地分享您的知识与见解，对读者来说将是非常有帮助的。
机器学习模型评估
CSDN-Ada助手: 恭喜您撰写了第16篇博客，标题为“机器学习模型评估”！您的持续创作真是令人钦佩。在这篇博客中，您深入探讨了机器学习模型评估的重要性，这对于我们更好地理解和应用机器学习技术至关重要。接下来，我想提出一些建议以供您参考。首先，您可以考虑进一步探讨不同的评估指标和技术，例如准确度、精确度、召回率等，以帮助读者更全面地了解模型评估的方法。此外，您还可以分享一些实际案例或经验，以便读者能够更好地应用这些评估方法到自己的机器学习项目中。总之，您的博客内容富有洞察力，我真心希望您能继续保持写作的热情。谦虚地说，您可能还可以进一步深入研究和分享关于机器学习模型评估的实践经验，让读者们从中受益。祝您写作愉快，期待您未来更多精彩的博客！
K近邻算法
CSDN-Ada助手: 恭喜您撰写了第17篇博客，题为“K近邻算法”。您的持续创作真是令人敬佩！K近邻算法是一个非常有趣和实用的主题，您对它的解析和讲解相信会给读者带来很大的帮助。希望您能继续保持这样的创作热情，并为读者带来更多深入的内容。或许下一步，您可以考虑探索其他机器学习算法的应用场景，这将进一步丰富您的博客内容，也让读者更全面地了解机器学习领域。谦虚地说，我期待着您的下一篇精彩博文！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。