聚类分析数据集_《NBA球员数据集聚类分析》

最新推荐文章于 2024-06-06 15:10:24 发布

weixin_39653361

最新推荐文章于 2024-06-06 15:10:24 发布

阅读量1.9k

点赞数 3

文章标签：聚类分析数据集

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39653361/article/details/111361908

版权

本文介绍了Kmeans聚类算法在NBA球员数据集上的应用，通过处理和分析球员得分、命中率等指标，利用轮廓系数法和间隔统计量法确定最佳K值为3，将球员分为三类，揭示了不同类别球员的特征差异。

摘要由CSDN通过智能技术生成

Hello大家好，今天为大家送上Kmeans聚类算法的案例，图片处理与NBA群员信息的分析。

Kmeans算法是非监督的学习里面的一个经典算法，也是一个典型的基于距离的非层次聚类算法，在小化误差函数的基础上，将数据划分为预定的类数K(这个k我们稍后说)，采用距离作为相似性的评价指标，及认为俩个对象的距离越近，其相似度越高。

可能大家有点懵，这个Kmeans到底是什么呢，其实他就是我们的扎堆算法(个人定义的)，为啥这么说呢，大家都知道人以类似物以群分，在我们拿到一堆数据集后这堆数据集没有我们所需要的标签，这时候我们就需要将相似度高的分为一组(专业术语称之为一簇)，而分为多少簇呢就是这个K；比如上学时老师根据学习成绩和平时表现将学生分为学霸,学酥，学渣等；在比如利用国家个城市的经济，医疗等数据将其划分为几种不同的贫富等级(如发达,欠发达,贫困,特贫困等)

当然，聚类算法不仅仅可以将数据实现分割，还可以用于异常点的监控，所谓的异常点就是远离任何簇的样本，而这些样本往往就是需要关注的点，例如信用卡交易中的监控。

Kmeans算法其实就是这么简单，并没有太多的复杂的数学公式，接下来我们看看该算法的集体过程：

注意：聚类的结果可能依赖于初始聚类中心的随机选择，可能使得结果严重偏离全局最优分类。在实际应用中为了得到较好的结果，通常以不同的初始聚类中心多次运行Kmeans算法。

下图为Kmeans聚类示意图：

最低0.47元/天解锁文章

weixin_39653361

关注

3
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
聚类分析数据集_《NBA球员数据集聚类分析》

Hello大家好，今天为大家送上Kmeans聚类算法的案例，图片处理与NBA群员信息的分析。 Kmeans算法是非监督的学习里面的一个经典算法，也是一个典型的基于距离的非层次聚类算法，在小化误差函数的基础上，将数据划分为预定的类数K(这个k我们稍后说)，采用距离作为相似性的评价指标，及认为俩个对象的距离越近，其相似度越高。可能大家有点懵，这个Kmeans到底是什么呢，其实他就是我们的扎堆算法(...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。