车辆行驶行为聚类K-Means——雷达图

锕鲡鴏

已于 2023-06-09 19:11:16 修改

阅读量1.5k

点赞数 1

文章标签：聚类机器学习 python

于 2023-06-08 17:11:14 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Otsider/article/details/131110826

版权

本文使用K-Means算法对车辆行驶数据进行聚类，通过雷达图展示聚类结果。涉及数据预处理，包括时间窗口选择、行驶次数分布、平均行驶时长、平均行驶里程和平均速度。最后，绘制了最优K值的聚类雷达图和聚类中心点的雷达图。

摘要由CSDN通过智能技术生成

目录

一、聚类K-Means算法

二、雷达图

2.导入使用的数据：

3.数据预处理

1.时间窗口选择

2.车辆行驶次数分布

3.车辆平均行驶时长

4.平均行驶里程

4.构造聚类用数据集

5. 画出最优K值的K均值模型聚类结果的雷达图以及各类样本数量的饼图

6.画两个聚类的中心点的雷达图

结果显示：

7. 附：完整代码

代码示例：

前言：

本文内容是通过聚类K-Means方法实现车辆行驶次数，车辆平均行驶时长，车辆行驶里程，平均速度等4个变量的雷达图显示

一、聚类K-Means算法

K-means算法是既简单和最经典的测试距离的算法

kmeans算法又名k均值算法,K-means算法中的k表示的是聚类为k个簇，means代表取每一个聚类中数据值的均值作为该簇的中心，或者称为质心，即用每一个的类的质心对该簇进行描述。
其算法思想大致为：先从样本集中随机选取 k个样本作为簇中心，并计算所有样本与这 k个“簇中心”的距离，对于每一个样本，将其划分到与其距离最近的“簇中心”所在的簇中，对于新的簇计算各个簇的新的“簇中心”。
根据以上描述，我们大致可以猜测到实现kmeans算法的主要四点：
（1）簇个数 k 的选择
（2）各个样本点到“簇中心”的距离
（3）根据新划分的簇，更新“簇中心”
（4）重复上述2、3过程，直至"簇中心"没有移动
优缺点：

优点：容易实现
缺点：可能收敛到局部最小值，在大规模数据上收敛较慢

二、雷达图

雷达图是以从同一点开始的轴上表示的三个或更多个定量变量的二维图表的形式显示多变量数据的图形方法。轴的相对位置和角度通常是无信息的。雷达图也称为网络图，蜘蛛图，星图，蜘蛛网图，不规则多边形，极坐标图或Kiviat图。它相当于平行坐标图，轴径向排列。【百度】

1.导入pandas库

注意：这里我只导入了一个库，是因为我还是个新手，所以想一个一个步骤来的，其实在这里可以把这个代码运用的所有库都导入进来也是可以的。

import pandas as pd

2.导入使用的数据：

利用pandas库中的方法获取指定文件的所有数据。

注意：我用的是我自己上课时间老师给的数据，这里需要的是你所需要的数据的相对路径，代码才能正常运行。运行代码后它就是一个列表的形式显示

代码实例：

data_car = pd.read_excel(r'新能源汽车行驶里程表(

最低0.47元/天解锁文章

关注

1
点赞
踩
13

收藏

觉得还不错? 一键收藏
1
评论
车辆行驶行为聚类K-Means——雷达图

本文内容是通过聚类K-Means方法实现车辆行驶次数，车辆平均行驶时长，车辆行驶里程，平均速度等4个变量的雷达图显示
复制链接

扫一扫

锕鲡鴏 CSDN认证博客专家 CSDN认证企业博客

码龄2年

4: 原创

158万+: 周排名

31万+: 总排名

3426: 访问

: 等级

49: 积分

4: 粉丝

6: 获赞

5: 评论

22: 收藏

私信

关注

热门文章

最新评论

欧洲十年间的天气数据部分指标统计--Spark&Scala
CSDN-Ada助手: 恭喜您在博客上发布了这篇关于欧洲十年间天气数据部分指标统计的文章！您对Spark和Scala的运用展现了您的技术实力和研究深度，让读者受益匪浅。接下来，我建议您可以考虑增加一些实际案例或者数据可视化的内容，以更直观地展现您的研究成果。期待您的下一篇作品！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
hadoop学习心得以及完全分布式配置。
CSDN-Ada助手: 评论：非常感谢您分享关于Hadoop学习心得以及完全分布式配置的博文。这篇博文对于初学者来说是一个很好的指南，因为您提到了Hadoop的核心内容——分布式存储和分布式计算。这两个部分确实是了解Hadoop的基础。我鼓励您继续创作，因为您的博文可以帮助更多的人理解和应用Hadoop。另外，如果您想要进一步扩展知识和技能，我建议您深入了解Hadoop的生态系统，例如Hadoop的相关工具和框架，如Hive、Pig、HBase等。这些工具和框架可以进一步优化和扩展Hadoop在大数据处理方面的能力。同时，您还可以学习更多关于Hadoop的调优和性能优化的技巧，以提高Hadoop集群的效率和可靠性。此外，了解Hadoop的安全性和权限管理也是一个重要的扩展知识，可以帮助您更好地保护和管理数据。总之，您的博文为我们提供了一个很好的入门指南，但Hadoop是一个庞大而复杂的生态系统，还有很多值得深入研究的地方。希望您能继续分享您的学习心得和经验，让我们共同进步。谢谢！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
【Java】学生管理系统MVC
CSDN-Ada助手: 恭喜您写了第三篇博客！标题【Java】idea编写学生管理系统】非常吸引人。看到您持续创作，我对您的努力表示赞赏。不过，如果我可以提供一些建议的话，我建议您可以在下一篇博客中介绍一下学生管理系统的具体功能和实现过程，这将使读者更加深入地了解这个主题。希望您能保持谦虚的态度，并继续分享您的经验和知识。期待看到您的下一篇博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
【Java】学生管理系统MVC
你我春风皆过客: 求一份你的源码可以吗？cml12899@163.com ，万分感谢
车辆行驶行为聚类K-Means——雷达图
CSDN-Ada助手: 恭喜您成功写下第一篇博客！初次尝试博客创作不易，但您已经成功迈出了第一步。关于“车辆行驶行为聚类-雷达图”，这是一个非常有趣的话题。下一步，建议您可以尝试深入探究不同车型在行驶行为方面的差异，或者探讨不同地区或时间段的行驶行为变化趋势。期待您的更多作品！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1 如果您持续创作，完成第三篇博客，并且质量分达到 80 分以上，在评论区就有机会获得红包奖励哦！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。