Seaborn数据分类绘图
分类散点图
sns.set()
tips = sns.load_dataset('tips')
print(tips.head(5))
sns.catplot(x='day',y='total_bill',kind='strip',data=tips) #缺陷会出现数据重叠
plt.show()
用kind='strip'方式绘制的分类散点图有数据重叠的缺陷,可以用kind='swarm'来绘制
sns.catplot(x='day',y='total_bill',data=tips,kind='swarm',hue='time')
plt.show()
根据情况可以将分类变量有垂直方向改称水平方向
类别内部整体分布
箱型图
数据量大时没办法用分类散点图,可以用箱型图来查看类别中数据的整体分布,有没有离群值/异常值,具体判断和处理离群值
sns.set()
sns.catplot(x='day',y='total_bill',kind='box',data=tips)
plt.show()
小提琴图
用来分析数据密度
#分析数据密度
sns.set()
sns.catplot(x='day',y='total_bill',data=tips,hue='time',kind='violin',
split=True,inner='stick',palette='pastel')
plt.show()
kind='violin'绘制小提琴图,split将类别内数据分开显示,inner在小提琴图上显示数据分布线,palette控制线条颜色
类别内部整体趋势
条形图
集中反映数据趋势
sns.set()
sns.catplot(x='sex',y='total_bill',hue='time',kind='bar',data=tips)
plt.show()
点图
散点图中点的位置估计数值变量的集中趋势,表现第一个分类变量和第二个分类变量的集中变化趋势
sns.set()
sns.catplot(x='sex',y='tip',hue='time',data=tips,kind='point')
plt.show()