盒图由五个数值点组成,最小观测值,下四分位数,中位数,上四分位数,最大观测值
IQR = Q3 - Q1 Q3表示上四分位数, Q1表示下四分位数,IQR表示盒图的长度
最小观测值 min =Q1 - 1.5*IQR
最大观测值 max=Q3 + 1.5*IQR , 大于最大值或者小于最小值就是离群点
1. 画出一个盒图 plt.boxplot(tang_array, notch=False, sym='o', vert=True) # tang_array表示输入的列表, notch表示盒图的样子,sym表示偏离值的表示方法, vert表示竖着,还是横着
import matplotlib.pyplot as plt import numpy as np # 构造正态分布的列表数组 tang_array = [np.random.normal(0, std, 100) for std in [0.1, 0.2, 0.3, 0.4]] fig = plt.figure(figsize=(8, 6)) plt.boxplot(tang_array, notch=False, sym='o', vert=True) plt.xticks([x+1 for x in range(len(tang_array))], ['x1', 'x2', 'x3', 'x4']) plt.title('box plot') plt.xlabel('x') plt.show()
2 设置盒图的线条颜色
import matplotlib.pyplot as plt import numpy as np # 构造正态分布的列表数组 tang_array = [np.random.normal(0, std, 100) for std in [0.1, 0.2, 0.3, 0.4]] fig = plt.figure(figsize=(8, 6)) bplt = plt.boxplot(tang_array, notch=False, sym='o', vert=True) for compnent in bplt.keys(): for line in bplt[compnent]: line.set_color('red') plt.xticks([x+1 for x in range(len(tang_array))], ['x1', 'x2', 'x3', 'x4']) plt.title('box plot') plt.xlabel('x') plt.show()
3.对盒图进行填充操作 设置pacth_artist=True 对盒图面进行填充bplt['boxes'].set_facecolor('r')
tang_array = [np.random.uniform(0, std, 100) for std in [0.1, 0.2, 0.3, 0.4]] bar_labels = ['x1', 'x2', 'x3', 'x4'] fig = plt.figure() plt.xticks([x+1 for x in range(len(tang_array))], bar_labels) bplt = plt.boxplot(tang_array, notch=False, sym='o', vert=True, patch_artist=True) colors = ['pink', 'lightblue', 'lightgreen'] for pacthes, color in zip(bplt['boxes'], colors): pacthes.set_facecolor(color) plt.show()
4. 设置小提琴图
fig, axes = plt.subplots(nrows=1, ncols=2, figsize=(12, 5)) tang_data = [np.random.normal(0, std, 100) for std in range(1, 4)] axes[0].violinplot(tang_data, showmeans=False, showmedians=True) axes[0].set_title('violin plot') axes[1].boxplot(tang_data) axes[1].set_title('box plot') for ax in axes: # 对y轴加上网格 ax.yaxis.grid(True) ax.set_xticks([y+1 for y in range(len(tang_data))]) # 对每个图加上xticks操作 plt.setp(axes, xticks=[y+1 for y in range(len(tang_data))], xticklabels=['x1', 'x2', 'x3']) plt.show()