如何用python的画几组数据量不同的boxplot（箱线图）

本文链接：https://blog.csdn.net/LeizRo/article/details/78524238

使用pandas里的dataframe数据结构存放待显示的数据。
dataframe和Series的知识不再讲解，可以看这个博文。
如果希望显示的各个数据列表中，数据长度不一致，可以先用Series函数转换为Series数据，再存储到dataframe中，对应index的value值若不存在则为NaN
正常情况下，若各组数据长度一致，则dataframe长这样：
0 1
0 1 5
1 2 6
2 3 7
3 4 8
如果长度不一致，长这样：
0 1
0 1 5
1 2 6
2 3 7
3 NaN 8
后面直接用boxplot就可以
代码原型参考了这篇博客

# -*- coding: utf-8 -*-

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd


def list_generator(mean, dis, number):  # 封装一下这个函数，用来后面生成数据
    return np.random.normal(mean, dis * dis, number)  # normal分布，输入的参数是均值、标准差以及生成的数量


# 我们生成四组数据用来做实验，数据量分别为70-100
list1 = list_generator(0.8531, 0.0956, 70)
list2 = list_generator(0.8631, 0.0656, 80)
list3 = list_generator(0.8731, 0.1056, 90)
list4 = list_generator(0.8831, 0.0756, 100)
s1 = pd.Series(np.array(list1))
s2 = pd.Series(np.array(list2))
s3 = pd.Series(np.array(list3))
s4 = pd.Series(np.array(list4))
# 把四个list导入到pandas的数据结构中，dataframe
data = pd.DataFrame({"1": s1, "2": s2, "3": s3, "4": s4})
data.boxplot()  # 这里，pandas自己有处理的过程，很方便哦。
plt.ylabel("ylabel")
plt.xlabel("xlabel")  # 我们设置横纵坐标的标题。
plt.show()