数据可视化与数据挖掘——条形图&K-means聚类

最新推荐文章于 2024-11-18 19:33:04 发布

Atlas Wong

最新推荐文章于 2024-11-18 19:33:04 发布

阅读量1k

点赞数 2

分类专栏：数据分析与数据挖掘文章标签： python 数据分析机器学习

本文链接：https://blog.csdn.net/AtlasWong/article/details/118314457

版权

光头加跑车，不一定是郭达斯坦森在演速激，也可能是数据分析师在“汽车之家”搞调研。虽然咱买不起豪车,救不了世界,但分析点有意思的东西出来跟其他程序猿侃侃天吹吹牛也还蛮有趣的。
在这里插入图片描述

一、导入数据集

df = pd.read_csv('D:/code_data/virtualization/mtcars.csv')
df.head(5)

在这里插入图片描述
字段解释：
1.mpg：英里每加仑（Miles per gallon）值越大性能越好，或是能源利用效率更高，或速度较快
2. cyl：气缸数量（Number of cylinders）
3. disp ：排量（Displacement）
4.hp：总马力（horsepower）
5.drat：驱动轴比（drive axle ratio）
6.wt：重量（Weight (lb/1000)）
7.qsec：1/4英里所用时间（quarter mile time(secend)）
8.vs：引擎（0-V shape，1-straight）
9.am：变速器（Transmission，0-automatic,1-manual）
10.gear：前进档数（Number of forward gears） #除了倒挡之外还有几个档
11.carb：化油器数量（Number of carburetors） #内燃机中用于混合空气和液体燃料的精细喷雾的装置。
12.fast: 是否快速（mpg>4 即为1，反之为0）
13.cars：汽车名称
14.carname：汽车名称（与cars完全相同）

二、绘制基本图像

plt.figure(figsize=(12 ,8))
plt.hlines(y=df.cars,xmin=0,xmax=df.mpg
          ,linewidth=5
          ,color='red'
          ,alpha=0.5); #加分号和plt.show()效果一样