一图胜千言,使用Python的matplotlib库,可以快速创建高质量的图形。
我们团队推出一个新的系列教程:Python数据可视化,针对初级和中级用户,将理论和示例代码相结合,使用matplotlib, seaborn, plotly等工具实现可视化。
本文的主题是如何用Matplotlib创建箱线图(boxplot)。
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
plt.style.use("ggplot")
1. 创建基础箱线图
箱线图(box-plot): 描述数值变量分布的统计图表,使用的样本统计量包括最小值,最大值,中位数,25%分位数(下四分位数),75%分位数(上四分位数)。在箱线图中,x轴表示数据的类别,y轴表示数据的分布。
Matplotlib创建箱线图的接口:boxplot(x, notch, vert, patch_artist, whis, widths, labels)
参数:
- x: 包含数值变量的数组(一个箱体),或包含多个向量的数组(多个箱体)
- notch: True -> 锯齿形箱体,False -> 矩形箱体
- vert: True -> 垂直箱体,False -> 水平箱体
- patch_artist: True -> 用Patch Artist而不是Line2D创建箱体,前者可以高度定制箱体的样式
- whis: 浮点值或包含两个浮点值的元组,默认为1.5,控制须线的位置
- 浮点值,箱体下方的须线 = Q 1 − w h i s ∗ ( Q 3 − Q 1 ) Q1 - whis*(Q3-Q1) Q1−whis∗(Q3−Q1),箱体上方的须线 = Q 3 + w h i s ∗ ( Q 3 − Q 1 ) Q3 + whis*(Q3-Q1) Q3