EDA复习整理 数据可视化 时间序列图 线图 直方图和密度图 热图 数据分布可视化图 变量间的相关性 皮尔逊相关性 肯德尔相关性 斯皮尔曼相关性 时间序列模式 趋势 季节性 周期性 数据可视化 时间序列图 线图 在该图中,时间在x轴上显示,沿y轴具有观察值。 可以看到数据整体的波动,以及看到一些尖峰+低谷,发现一些异常。 直方图和密度图 热图 颜色越深,越负相关,颜色越浅,越正相关。 数据分布可视化图 变量间的相关性 我们经常会用 相关系数 衡量两个两个变量之间的相关强度。假如已知两个变量 x 和 y ,那么它们之间的相关系数为 r 的值始终在-1到1之间。当两个变量完全负相关时, r 值为-1