python花瓣长度和花瓣宽度散点图鸢尾花_matplotlib可视化操作及案例分析

matplotlib 可视化总结

之前的几期中,我们推出了python语法和pandas数据处理的模块,这是用来做数据分析最不可或缺的技能。今天我们接着推出matplotlib可视化的模块。可视化也是在整个数据分析流程中必不可少的一个环节,因为图形远比单纯的数字易于理解和接受,一个好的可视化图形能够“不言自明”,给听众留下深刻的印象。这一期推出的matplotlib模块,是python中应用最为广泛的一个可视化工具包,它可以对整个可视化的图形进行“雕刻”,让图形满足我们表达信息,传递信息的需要。

做可视化工作需要分成以下三个阶段:

数据准备:将需要进行可视化的数据进行处理,如异常值的处理,以及数据格式转化等(Pandas 处理过程)

数据类型:数值型数据 or 分类型数据

数据异常:取值异常 or 数据缺失

确定图表:思考需要用什么图来分析比较合适,不同的目的所需要的图表也不同。

关联分析:散点图或折线图。观察两个变量之间的相关关系

分布分析:柱状图,密度图。观察数据的分布

分类分析:柱状图或箱式图。按类别进行分析

分析输出结论:这也是做可视化的目的,是可视化最重要的一步。对可视化的图形进行分析,得出结论,一般而言,这种结论是直接观察数据不易发现的结论。

对于matplotlib这个模块来说,由于涉及到的内容太多,因此要从实践,从需求出发,不适合按照知识点的模式进行学习,采用“用中学”的方法能够极大的提高学习效率。在这个模块中,我们会以几个简单的案例来对matplotlib常用的命令进行说明,主要目的是利用这几个简单案例将基本常用的操作命令都用到,因此不追求案例的新颖性。

在开展具体的案例之前,我们先抛出一张在matplotlib中各个对象名称的图片,这对大家理解非常有帮助,在后边文章中遇到不理解的可以参考这张图片。

案例一:航班乘客分析

在另一个可视化模块seaborn中,我们可以直接从网络上下载数据集,因此不用自己准备数据来练习matplotlib操作。

在打算利用matplotlib作图之前,一般需要导入以下包。

import matplotlib as mpl

from matplotlib import pyplot as plt

import pandas as pd

#这一行很重要,只有写了这一行代码,可视化后的图形才能在notebook中展现出来

%matplotlib inline

加载需要用到的数据集并进行展示。

#导入seaborn包

import seaborn as sns

#加载数据集

data = sns.load_dataset('flights')

data.head()

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值