python 箱线图-Python-matplotlib统计图之箱线图漫谈

本文介绍了Python中使用matplotlib库绘制箱线图的方法,包括基本的箱线图绘制、参数设置、图形美化以及如何通过箱线图进行数据分布和异常值的分析。通过实例展示了如何自定义箱线图的颜色、形状、填充以及如何通过箱线图对比不同类别数据的分布差异。
摘要由CSDN通过智能技术生成

(1)

箱线图,又称箱形图(boxplot)或盒式图,不同于一般的折线图、柱状图或饼图等传统图表,只是数据大小、占比、趋势等等的呈现,其包含一些统计学的均值、分位数、极值等等统计量,因此,该图信息量较大,不仅能够分析不同类别数据平均水平差异(需在箱线图中加入均值点),还能揭示数据间离散程度、异常值、分布差异等等。

在python中常用matplotlib的boxplot来绘制,最简单绘制的如下:

import numpy as np

import matplotlib.pyplot as plt

import pandas as pd

np.random.seed(2) #设置随机种子

df = pd.DataFrame(np.random.rand(5,4),

columns=['A', 'B', 'C', 'D'])#先生成0-1之间的5*4维度数据,再装入4列DataFrame中

df.boxplot() #也可用plot.box()

plt.show()

b2f70f867a4a

Paste_Image.png

从图形可以看出,A、B、C、D四组数A、D数据较集中(大部分在上下四分位箱体内),但都有异常值,C的离散程度最大(最大值与最小值之间距离),以均值为中心,B分布都有明显右偏(即较多的值分布在均值的右侧&

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值