EDA复习整理 | 如何看多种多样的图? | 如何从各种图中提取出有用的数据? | 变量间的相关性分析与独立性分析

本文详述了如何通过时间序列图(线图、直方图、密度图、热图)来理解数据波动及异常。讨论了变量间相关性的分析,包括皮尔逊、肯德尔和斯皮尔曼相关系数的计算与应用,同时介绍了时间序列模式中的趋势、季节性和周期性概念。
摘要由CSDN通过智能技术生成

数据可视化

时间序列图

线图

在这里插入图片描述
在该图中,时间在x轴上显示,沿y轴具有观察值。
可以看到数据整体的波动,以及看到一些尖峰+低谷,发现一些异常。

直方图和密度图

在这里插入图片描述

热图

在这里插入图片描述
颜色越深,越负相关,颜色越浅,越正相关。

数据分布可视化图

变量间的相关性

我们经常会用 相关系数 衡量两个两个变量之间的相关强度。假如已知两个变量 x 和 y ,那么它们之间的相关系数为
在这里插入图片描述
r 的值始终在-1到1之间。当两个变量完全负相关时, r 值为-1

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值