箱形图
1.什么是箱形图?
用作显示一组数据分散情况资料的统计图,主要通过数据中最大值、最小值、中位数、四分位数来反应数据分散程度。
2.如何绘制箱形图?
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
% matplotlib inline
# 箱型图
# 创建数据
data = pd.DataFrame({'A':np.random.rand(100)*1000})
a_r = data['A'].max() - data['A'].min()
#最小值
print('A中最小值为: %.2f' %(data['A'].min()))
#最大值
print('A中最大值为: %.2f' %(data['A'].max()))
# 极差
print('A中极差为:%.2f'%(a_r))
# 没有考虑中间变量的变动,测定离中趋势不稳定
color = dict(boxes='DarkGreen', whiskers='DarkOrange', medians='DarkBlue', caps='Gray')
data.plot.box(vert=False,grid = True,color = color,figsize = (10,3))
效果:A中最小值为: 6.87,A中最大值为: 996.06,A中极差为:989.20
3.他有什么作用
- 突出一组数据的异常值
- 反映一组数据分布偏态和尾重的信息
- 通过数据的形状,反映数据的分布