数据的关联性
数据的关联性,其核心就是指量化的两个数据间的数据关系。关联性强,是指当一个数值增长时,另一个数值也会随之发生变化。相反地,关联性弱,是指当一个数值增长时,另一个数值基本不会发生变换。
数据的关联性主要有正相关、负相关、和不相关关系。
seaborn
seaborn主题
- Darkgrid
- Whitegrid
- Dark
- White
- ticks
sns.set(style="")
或
sns.set_style("")
sns.despine
- 指定figure对象,可选,默认为当前figure对象
- ax:指定axes对象,可选
- top,right,left,bottom:如果为True,则移除对应方向的坐标轴
- offset:坐标轴的偏移距离
- trim:限制轴线的显示范围
sns.despine()移除上右边的坐标轴
散点矩阵
在散点矩阵图中,将图形分为多个方格,在某个放个中单独绘制某个维度的数据
sns.pairplot(df,diag_kind=‘kde’)
diag_kind:控制对角线部分
pairplot:
- kind:图类型,可选值为Scatter、reg
- diag_kind:对角线图类型,可选值为hist,kde
- size:默认6,图的尺寸大小
- hue:使用指定变量为分类相变画图
- palette:调色板颜色
- markers:使用不同的形状
气泡图
数据的分布性
茎叶图
直方图
密度图