Seaborn分类分析绘图
%matplotlib inlineimport numpy as npimport pandas as pdimport matplotlib as mplimport matplotlib.pyplot as pltimport seaborn as snssns.set(style="whitegrid", color_codes=True)
np.random.seed(sum(map(ord, "categorical")))titanic = sns.load_dataset("titanic") #导入泰坦尼克数据集tips = sns.load_dataset("tips") #导入小费数据集iris = sns.load_dataset("iris") #导入鸢尾花数据集
散点图
sns.stripplot(x="day", y="total_bill", data=tips)
问题:有重叠,无法看见数据的密度。
解决方法一:通过jitter抖动
抖动是平时可视化中的常用的观察“密度”的方法,除了使用参数抖动,特定的抖动需求也可以用numpy在数据上处理实现
sns.stripplot(x="day", y="total_bill", data=tips, jitter=True) # jitter抖动
解决方法二:通过swarmplot()函数
sns.swarmplot(x="day", y="total_bill", data=tips)
sns.swarmplot(x="day", y="total_bill", hue="sex",data=tips) #hue 参数控制分组绘图