数据可视化——用python绘制气泡图、三维散点图、多重柱形图案例

本文详细介绍了如何使用Python绘制气泡图、三维散点图和多重柱形图。通过实例展示了在数据分析中如何利用pandas、pyecharts等库读取数据、处理数据异常,并通过matplotlib和pyecharts库生成各种图表,以直观展示数据关系。
摘要由CSDN通过智能技术生成

目录

前言

一、气泡图的绘制

1、什么是气泡图?他适用于什么数据?

2、图形效果展示

3、导入需要用到的库

4、读取要分析的数据

5、检查数据是否有问题

6、将要对比数据提取出来

7、画图

二、三维散点图的绘制

1、什么是三维散点图?

2、导入需要用到的数据库

3、画图

三、多重柱形图的绘制

1、什么是多重柱形图?

2、效果图展示

3、导入需要用到的库

4、读取要分析的数据

5、分组聚合

6、遍历

7、画图

四、总结


前言

气泡图与散点图十分相似,它们总称为数据关系型图,散点图主要分为二维散点图与三维散点图、常用于反映数值之间的相对位置,而气泡图常用于展示三维甚至四维变量的关系,由一个个像气泡元素组成。而多重柱形图可以用来展现某个分类下多个数据的对比。接下来让我们一起来看看气泡图和、三维散点图和多重柱形图的绘制。本人也是一位正在学习中的新手,了解有限,有什么错误的地方大家多多指点。

一、气泡图的绘制

1、什么是气泡图?他适用于什么数据?

气泡图的其中一条变量的表现形式是体现在气泡的大小或颜色深浅上,如果一个数据集中包含非常多的点,那么散点图可以将这些数据对比的结果一目了然,是比较适用的。

2、图形效果展示

3、导入需要用到的库

import pandas as pd
import pyecharts.options as opts
from pyecharts.charts import Scatter

在这里我们导入pandas库,pandas库是数据分析中非常常用的库,用于读取csv、xls等文件中的数据。

从pyecharts导入options,在生成图表时,可以根据实际情况设置这些选项更改外观

4、读取要分析的数据

下面以航空公司数据为例,分析年龄、飞行次数、飞行间隔之间的关系

data = pd.read_excel(r'航空公司数据-剔除空年龄.xlsx')

 在这里,我读取的是xls文件,如果你需要读取的文件为csv,那你可以参照这个写法:

                data = pd.read_csv(r'航空公司数据-剔除空年龄.csv',encoding = 'gbk')

注意:当目标文件和当前文件不在同级目录时,读取数据时可以考虑使用绝对路径或者在相对路径前加上相对路径特殊符号,如:../、../../

5、检查数据是否有问题

data_select = data.loc[:100,['年龄','飞行次数','最大乘机时间间隔']]
data_select.isnull().sum()

                                         

loc[]切片:使用.loc[ ]第一个参数是行索引,第二个参数是列索引

pandas库中有一个isnull()函数,它可以用来判断缺失值

其中:isnull().sum()可以用于查询每列缺失值的数量

           isnull().any()可以用于判断哪些列包含缺失值,并且在缺失值返回True,反之False。

注意:如果数据有异常值也需要对异常值进行处理

6、将要对比数据提取出来

x = data_select['飞行次数'].tolist()
y = data_select['最大乘机时间间隔'].tolist()
z = data_select['年龄'].tolist()
x

  • 6
    点赞
  • 53
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值