Pandas绘图

Pandas绘图

  • 数据可视化

不仅可以加载转换,还可以可视化

  • 单变量可视化

包括形图,折线图,直方图,饼图

格式: df对象 或者 Series 对象.plot图形函数(参数)

df对象 或者Series对象.plot(kind='图像名',参数...)

图形: bar: 条形图(柱状图)

:适用于: 类别型数据展 示

  • line: 折线图

适用于: 连续的数值序列

  • area: 面积图

适用于: 多变量. 单变量情况下,面积图 = 对折线图空白部分进行填充.

  • hist: 直方图

适用于: 展示数据的分布情况,要是:均匀的数据,不要发生 数据倾斜.

  • pie: 饼图

适用于: 少量分类 在整体的占比

  • 散点图:分析1个变量的变量 会不会影响 另一个变量值

scatter()

应用场景: 数据量相随较小.

唯一值较多

  • 蜂巢图: hexbin()

应用场景: 数据量大.少均可

唯一值较多

  • 堆叠图: 在柱状图的基础上,把多个分类的信息 堆叠到一起

应用场景: 少量分类的信息 ,双变量情况

baar(stacked=True)

  • 面基堆积:area()

应用场景: 少量分类的信息, 双变量,多变量情况

  • 折线图: 适用于: 连续的数值序列,双变量, 多变量,观察其实走向.

line()

Seaborn简介

  • Seaborn是基于matplotlib的图形 可视化包.他提供了一种高度交互界面,便于用户能够做出各种有吸引力的统计图表

  • Seaborn是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在大多数情况下使用seaborn能够做出更具有吸引力的图,而使用matplotlib就能制造更多特色的图

  • Seaborn和Panda的API配合的很好,使用DataFrame/Series的数据可以绘图

  • seaborn: statistical data visualization — seaborn 0.13.2 documentation

Seaborn绘图-计数柱状图
  • 概述

    • 计数图和直方图很像,直方图通过对数据组来描述分布,

    • 计数图(条形图)是对离散变量(分类变量)计数.

  • 实例代码

# 计数图(条形图)
#1. 创建画布,坐标轴
fig,ax = plt.subplots(figsize=(12,6))
#2. 绘制计数柱状图,相当于根据day分组,然后再计数,把计数的结果绘制成柱状图,同下面代码效果类似
# sns.countplot(data=tips, x='day')
sns.countplot(data=tips, x='day')
# tips['day'].value_counts().plot.bar(color=['r','g','b','orange'])
# 3.设置图形标题
ax.set_title('技术状图',size=15)
# 4.具体的绘图动作
plt.show()

  • 密度图(核密度估计)
  • 密度图是展示单变量的另一种方法,本质上是通过绘制每个数据点为中心的正态分布,然后消除重叠的图,使曲线下的面积为1来创建的

  • 散点图: scatterpolt : data

    x

    y

    hue = 'sex'

    regplot() : 绘制拟合回归线

    fit_reg 默认是True

    fit_ reg=False 可以关掉

  • 蜂巢图

    • kinde='hex',加了这个属性就是 蜂巢图, 不加就是散点图.

  • 2D KDE图

    • 一维KDE 只传入x, 或者 只转入Y

    • 二维KDE x,y 都传入

    • fill = True 是否填充曲线内的颜色

    • cbar=True 是否显示 右侧的颜色示意条

双变量可视化
  • 箱线图: 用于显示多种统计信息: 最小值,1/4分位,中位数,3/4分位,最大值,以及离群值(如果有)

    • 箱线图读图

      • 箱子的中间有一条线,代表了数据的中位数

      • 箱子的上下底,分别是数据的上四分位数(Q3)和下四分位数(Q1)

      • 箱体包含了50%的数据.因此,箱子的高度在一定程度上反映了数据的波动程度

      • 上下边缘则代表了该组数据的最大值和最小值

        • IQR = 上四分位数(Q3) + 1.5IQR 大于这个值的就是异常值

        • 判断异常值时最大的值 = 上四分位数(Q3) +1.5IQR 大于这个值就是异常值

        • 判断异常值时最小值 = 下四分位数(Q1) - 1.5IQR小于这个值的就是异常值

      • 有时候箱子外部会有一些点, 可以理解为数据中的"异常值"

  • 小提琴图,它是经典的可视化方法,但可能会掩盖数据的分布

    • 小提琴图能显示与箱线图相同的值, 小提琴把"箱线"绘成核密度估计,

    • 有助于保留数据的更多可视化信息

多变量可视化
  • 概述

    • 绘制多变量数据没有标准的套路

    • 如果想在图中包含更多的信息,可以使用颜色,大小和形状来区分它们

Seaborn主题和样式
  • 概述

    • 上面的Seaborn图都采用了默认样式,可以使用sns.set_style函数更改样式

    • 该函数只要运行一次,后续绘图的样式都会发生变化

    • Seaborn有5种样式

      • darkgrid 黑色网格(默认)

      • whitegrid 白色网格

      • dark 黑色背景

      • white 白色背景

      • ticks

  • Seaborn绘图小结

    sns.XXXplot(data = df,x = '列名',y='列名',hue='列名')

    • 调整绘图区域的大小

      • plt.subplots(figsize=())

      • 如果plt.subplots(figsize=())不行,都会有一个height的参数,指定图片的高度 可以通过height 调整图片大小

      • height 高度 aspect宽高比例

  • 23
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值