统计学——协方差和相关系数

文章介绍了如何通过矩阵面积来直观理解变量之间的正负相关性,然后引出协方差的概念,作为衡量变量线性相关性的指标。接着,讨论了Pearson相关系数,它消除了单位影响,便于比较不同单位变量的相关性。此外,还提到了Spearman秩相关系数和Kendall相关系数,它们适用于非正态分布的数据,尤其是Spearman秩相关系数和Kendall相关系数在处理有序数据时更为适用。
摘要由CSDN通过智能技术生成

1.矩形面积

引入两个常见变量身高X和体重Y,这两者是比较常见的正相关,以下是一组身高和体重数据:
在这里插入图片描述
我们在平面坐标上先画出2个人的坐标点,然后以两个点画一个矩阵,为了后续更好的解释正负相关性,我们用红色表示正相关,蓝色表示负相关。那么前两个点之间就是红色矩阵。计算矩阵面积为(160-152)×(54-45)=72,结果是正数。
在这里插入图片描述
接下来我们在该平面上引入第三个点,那么第三个点和前两个点分别组成矩阵,由于该同学比较瘦高,那么第三个点和前两个点呈负相关,呈蓝色,如下图所示。计算其中一个蓝色矩阵面积(172-152)×(44-45)=-20,面积为负数。
在这里插入图片描述
以此类推,我们将所有点都引入到该平面,并画出所有矩阵,如下图所示
在这里插入图片描述
从以上平面中我们可以看到,平面中红色矩阵占大部分,而蓝色矩阵比较少,所以整体呈现红色。我们计算所有矩阵的面积,最后的结果也为正数,这说明X,Y这两个随机变量整体上是正相关的关系;如果蓝色矩阵占大多数,所有矩阵的面积为负数,则两个变量是负相关;如果两个颜色差不多,矩阵面积为0,则不相关。
我们用数学公式表示所有的矩阵面积如下:
A = ∑ i , j = 12... n i ≤ j ( x i − x j ) ( y i − y j ) A = \sum_{i,j=12...n}^{i≤j}(x_i-x_j)(y_i-y_j) A=i,j=12...nij(xixj)(yiyj)
那么 X 和 Y 的相关性 = { 正相关, A > 0 负相关, A < 0 不相关, A = 0 X和Y的相关性 = \left\{\begin{aligned}正相关,A>0\\ 负相关,A<0\\ 不相关,A=0 \end{aligned}\right. XY的相关性= 正相关,A>0负相关,A<0不相关,A=0

2.协方差

我们需要对上门的矩阵面积公式进行简化,我们用X的均值 μ X μX μX替换所有 X j X_j Xj,用Y的均值 μ Y μY μY替换所有 Y j Y_j Yj,则公式可以简化为:
A =

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AIGC人工智残

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值