Boxplot(箱形图或盒图)的介绍和使用

一、介绍

盒图是在1977年由美国的统计学家约翰·图基(John Tukey)发明的。它由五个数值点组成:最小值(min),下四分位数(Q1),中位数(median),上四分位数(Q3),最大值(max)。也可以往盒图里面加入平均值(mean)。如上图。下四分位数、中位数、上四分位数组成一个“带有隔间的盒子”。上四分位数到最大值之间建立一条延伸线,这个延伸线成为“胡须(whisker)”。

由于现实数据中总是存在各式各样地“脏数据”,也成为“离群点”,于是为了不因这些少数的离群数据导致整体特征的偏移,将这些离群点单独汇出,而盒图中的胡须的两级修改成最小观测值与最大观测值。这里有个经验,就是最大(最小)观测值设置为与四分位数值间距离为1.5个IQR(中间四分位数极差)。即IQR = Q3-Q1,即上四分位数与下四分位数之间的差,也就是盒子的长度。
最小观测值为min = Q1 - 1.5*IQR,如果存在离群点小于最小观测值,则胡须下限为最小观测值,离群点单独以点汇出。如果没有比最小观测值小的数,则胡须下限为最小值。

最大观测值为max = Q3 +1.5*IQR,如果存在离群点大于最大观测值,则胡须上限为最大观测值,离群点单独以点汇出。如果没有比最大观测值大的数,则胡须上限为最大值。

通过盒图,在分析数据的时候,盒图能够有效地帮助我们识别数据的特征:直观地识别数据集中的异常值(查看离群点)。判断数据集的数据离散程度和偏向(观察盒子的长度,上下隔间的形状,以及胡须的长度)。
1.箱体的左侧(下)边界代表第一四分位(Q1),而右侧(上)边界代表第三四分位(Q3)。至于箱体部分代表四分位距(IQR),也就是观测值的中间50%值。
2.在箱体中间的线代表的是数据的中位数值。
3.从箱体边缘延伸出去的直线称为触须(whisker).触须(whisker)的向外延伸表示了数据集中的最大和最小(异常点除外)。

4.极端值或异常点(outlier),用星号(*)来标识.如果一个值位于箱体外面(大于Q3或小于Q1),并且距离相应边界大于1.5倍的IQR,那么这个点就被认为是一个异常点(outlier)。

二、使用

matlab中:

1、随机数列

X = randn(100,25); %随机产生100*25 double数据

subplot(2,1,1);
boxplot(X) 
subplot(2,1,2);
boxplot(X,'plotstyle','compact')

结果如下:

2、m*n已知数据:

x=[0.7582 0.9809 0.9089 0.9841
   0.9529 0.9365 0.8307 0.8270
   0.9254 0.7601 0.9708 0.8859
   0.8475 0.9449 0.9100 0.9198 
   0.8599 0.9539 0.7721 0.7754]
subplot(2,1,1);
boxplot(x) 
subplot(2,1,2);

boxplot(x,'plotstyle','compact')

结果:

一列是一组。

 

  • 32
    点赞
  • 145
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
### 回答1: 可以使用以下方法来设置 `plt.boxplot` 的颜色和图像大小: - 使用 `color` 参数指定箱形图的颜色,例如:`color='red'`。 - 使用 `linewidth` 参数指定箱形图边框的宽度,例如:`linewidth=2`。 - 使用 `figsize` 参数指定图像的大小,例如:`figsize=(10, 6)`。 例如,以下代码将创建一个红色的箱形图,并将其边框的宽度设置为 2,并将图像大小设置为 (10, 6): ``` plt.boxplot(data, color='red', linewidth=2, figsize=(10, 6)) ``` 希望这能帮到你! ### 回答2: plt.boxplot()函数用于绘制箱线图,可以通过设置颜色和图像大小来定制化图形。具体方法如下: 颜色设置: plt.boxplot()函数可以通过`patch_artist=True`参数使得箱线图中的箱、须以及离群值的颜色可以自定义。首先,在绘制箱线图之前需要先创建一个BoxPlot对象,通过调用函数的返回值来获取该对象。然后,可以通过该对象的属性来进行颜色设置,如`boxprops`表示箱的属性,`whiskerprops`表示须的属性,`flierprops`表示离群值的属性。例如,可以设置箱的颜色为红色,箱线颜色为蓝色,离群值颜色为绿色,代码如下: ```python import matplotlib.pyplot as plt # 创建BoxPlot对象 bplot = plt.boxplot(data, patch_artist=True) # 设置箱的颜色 bplot['boxes'][0].set(color='red') # 设置箱线的颜色 bplot['whiskers'][0].set(color='blue') bplot['whiskers'][1].set(color='blue') # 设置离群值的颜色 bplot['fliers'][0].set(marker='o', color='green', alpha=0.5) plt.show() ``` 图像大小设置: 可以通过设置plt.figure()函数的figsize参数来调整图像的大小。该参数接受一个包含两个值的元组,分别表示图像的宽度和高度。默认单位是英寸,可以根据实际需要进行调整。例如,可以将图像的大小设置为10英寸乘以5英寸,代码如下: ```python import matplotlib.pyplot as plt plt.figure(figsize=(10, 5)) plt.boxplot(data) plt.show() ``` 以上是使用plt.boxplot()函数设置颜色和图像大小的方法。根据具体需求,可以灵活调整颜色和图像大小,使得绘制的箱线图更符合预期。 ### 回答3: plt.boxplot函数用于绘制箱线图,表示数据的分布情况。在绘制箱线图时,可以通过设置参数来调整颜色和图像的大小。 1. 颜色设置: 使用plt.boxplot函数时,可以通过设置参数patch_artist=True来启用填充颜色的功能。接着,可以使用参数boxprops来设置箱体的颜色,使用参数whiskerprops来设置须的颜色,使用参数capprops来设置箱线的颜色,使用参数medianprops来设置中位线的颜色,使用参数flierprops来设置离群值的颜色。 例如,可以使用以下代码将箱体颜色设为红色,箱线和中位线颜色设为蓝色,须的颜色设为绿色: ```python plt.boxplot(data, patch_artist=True, boxprops={'facecolor': 'red'}, whiskerprops={'color': 'green'}, capprops={'color': 'blue'}, medianprops={'color': 'blue'}, flierprops={'color': 'blue'}) ``` 这样就可以根据需要设定各个组件的颜色。 2. 图像大小设置: plt.boxplot函数绘制的图像大小可以通过设置figure的大小来实现。可以使用plt.figure函数来创建一个新的图像,并通过设置figsize参数来指定图像的宽度和高度。例如,可以使用以下代码设置图像大小为10英寸宽,6英寸高: ```python plt.figure(figsize=(10, 6)) plt.boxplot(data) ``` 这样就可以根据需要调整箱线图的大小,以适应实际需求。 注意:在进行颜色和图像大小的设置时,需要先导入matplotlib.pyplot库,并使用plt.show()函数显示图像。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值