matplotlib 均值_走进Matplotlib世界(九)

回顾

在走进Matplotlib世界(八)中,我们介绍了Matplotlib中极坐标的相关图表,包括极坐标图、极区图、极散点图的概念和基本用法。今天我们来看一下Matplotlib中的箱型图,以及Matplotlib对图像的处理。

箱型图

箱型图又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因形状如箱子而得名。在各种领域也经常被使用,常见于品质管理。它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较。

要绘制箱型图,我们需要了解最大值、最小值、中位数、两个四分位数(上四分位数和下四分位数)和异常值的概念。

最大值、最小值:一组数据中最大的数和最小的数。

中位数:按顺序排列的一组数据中居于中间位置的数,即在这组数据中,平均会有一半的数据比他大,有一半的数据比他小。

四分位数:也称四分位点,是指在统计学中把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值。四分位数指的是一组数据排序后处于25%和75%位置上的值。四分位数是通过3个点将全部数据等分为4部分,其中每部分包含25%的数据。很显然,中间的四分位数就是中位数,因此通常所说的四分位数是指处在25%位置上的数值(称为下四分位数)和处在75%位置上的数值(称为上四分位数)。四分位数的计算有(n+1)/4、(n+1)*3/4和(n-1)、(n-1)*3/4两种,我们一般使用第一种计算方式,那么下四分位数Q1=(n+1)/4,上四分位数Q3=(n+1)*3/4。

异常值:箱型图中的异常值判断以四分位数(Q3、Q1)和四分位距(IQR=Q3-Q1)为基础,异常值被定义为小于下边缘(Q1-1.5IQR)或大于上边缘(Q3+1.5IQR)的值。除了上下边缘,箱型图中还有极上限(Q3+3IQR)和极下限(Q1-3IQR)的概念。小于下边缘或大于上边缘的异常值称为中度异常,小于极下限或大于极上限的异常值称为极度异常。

有了上述的概念,就可以绘制出箱型图了。一个基本的箱型图如下所示,主要包含六个数据节点,将一组数据从大到小排列,分别计算出他的上边缘,上四分位数,中位数,下四分位数和下边缘,以及可能存在的异常值。

9137c58db8d04bc8246aea581b00ace4.png

箱型图概念

在Matplotlib中,箱型图使用box()或boxplot()绘制。我们使用box()方法分别绘制一个简单的箱型图和一个横向的箱型图。​

# 0、导入包import matplotlib.pyplot as pltimport numpy as npimport pandas as pd# 1、准备数据data = pd.DataFrame(np.random.rand(10, 4),
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值