小提琴图(Violin Plot):
绘制连续型数据的方法,可以认为是箱型图和核密度图的结合体;即内部是箱线图的变化,外部是核密度图,某区域的图形面积越大,某个值分布的概率就越大;
其中可以获得更多的信息,包括
(1)中位数:小提琴图上的白点;
(2)四分位数范围:小提琴中心的黑色条
(3)较低/较高的相邻值:
(4)峰值
与箱型图相比,小提琴图显示了数据的整体分布,有利于处理多模态数据
小提琴图中较宽的部分代表取值的概率较高,较窄的部分表示取值的概率低,偏离黑色条形图的值可以视为离群值,两端为最大值和最小值,可以显示多个峰值,而箱线图无法展示这一信息;
import seaborn as sns
import pandas as pd
import matplotlib.pyplot as plt
#导入库
#设置绘图风格
plt.style.use('ggplot')
#处理中文乱码
plt.rcParams['font.sans-serif'] = ['Microsoft YaHei']
#坐标轴负号的处理
plt.rcParams['axes.uni