如果一个图表需要展示三个变量,那么将会有以下四种情况:
(1) 三个变量都是数值变量
(2)两个是数值变量,一个是分类变量
(3)一个是数值变量,两个是分类变量
(4)三个都是分类变量
如果三个变量中至少有两个是数值型的,用散点图画出数值变量,然后使用非位置编码的方式可视化第三个变量。非位置的编码方式主要有三种:形状,大小,颜色
1、形状
对于无序分类变量,形状是一个很好的编码方式。每一个类别,可以使用一种形状。
cat_markers = [['A', 'o'],
['B', 's']]
for cat, marker in cat_markers:
df_cat = df[df['cat_var1'] == cat]
plt.scatter(data = df_cat, x = 'num_var1', y = 'num_var2', marker = marker)
plt.legend(['A','B'])
<