相关系数r和决定系数R2的那些事

本文探讨了相关系数r和决定系数R2在衡量变量间关系时的作用。r表示线性相关程度,其值介于-1到1之间,而R2衡量回归模型的拟合优度,用于评估预测值与实际值的吻合度。虽然r的平方可能是R2的一个部分,但R2不一定等于r的平方,且R2可能小于0。文章提醒读者在解读R2时要谨慎,不应将其作为模型预测能力的唯一标准。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

相关系数 r r r和决定系数 R 2 R^2 R2的那些事

有人说相关系数(correlation coefficient, r r r)和决定系数(coefficient of determination, R 2 R^2 R2,读作R-Squared)都是评价两个变量相关性的指标,且相关系数的平方就是决定系数?这种说法对不对呢?请听下文分解!

协方差与相关系数

要说相关系数,我们先来聊聊协方差。在之前的博文《使用Python计算方差协方差相关系数》中提到协方差是计算两个随机变量 X X X Y Y Y 之间的相关性的指标,定义如下:

C o v ( X , Y ) = E [ ( X − E X ) ( Y − E Y ) ] \mathrm{Cov}(X, Y) = \mathrm{E}[(X - \mathrm{E}X)(Y - \mathrm{E}Y)] Cov(X,Y)=E[(XEX)(YEY)]

但是协方差有一个确定:它的值会随着变量量纲的变化而变化(covariance is not scale invariant),所以,这才提出了相关系数的概念:

r = C o r r ( X , Y ) = C o v ( X , Y ) σ X ⋅ σ Y = E [ ( X − E X ) ( Y − E Y ) ] E [ X − E X ] 2 E [ Y − E Y ] 2 r = \mathrm{Corr}(X, Y) = \frac{Cov(X, Y)}{\sigma_X \cdot \sigma_Y} = \frac{\mathrm{E}[(X - \mathrm{E}X)(Y - \mathrm{E}Y)]}{\sqrt{\mathrm{E}[X - \mathrm{E}X]^2}\sqrt{\mathrm{E}[Y - \mathrm{E}Y]^2}} r=Corr(X,Y)=σXσYCov(X,Y)=E[XEX]2

评论 20
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值