回归中的相关度和决定系数及应用

  1. 皮尔逊相关系数 (Pearson Correlation Coefficient): 相关度
    1.1 衡量两个值线性相关强度的量
    1.2 r取值范围 [-1, 1]:
    正向相关: r>0, 负向相关:r<0, 无相关性:r=0
    1.3 相关度计算:
    在这里插入图片描述
    其中,Var是方差,展开计算就如下图所示:r=
    在这里插入图片描述
    在这里插入图片描述
    进行相关度计算

3 . 其他例子:
在这里插入图片描述

R平方值
4.1定义:决定系数,反应因变量的全部变异能通过回归关系被自变量解释的比例。
4.2 描述:如R平方为0.8,则表示回归关系可以解释因变量80%的变异。换句话说,如果我们能控制自变量不变,则因变量的变异程度会减少80%,值越大就表示拟合度越高。

简单线性回归:
R^2 = r * r
多元线性回归:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
SSR+SSE=SST
5. R平方也有其局限性:R平方随着自变量的增加会变大,R平方和样本量是有关系的。因此,我们要到R平方进行修正。修正的方法:
在这里插入图片描述
在python实现计算相关度和决定系数:
相关度计算;
在这里插入图片描述
R^2(决定系数)计算:
在这里插入图片描述
函数polyfit(x,y,degree)的功能是根据x,y,degree一次性求出回归方程包括所有系数,degree是x的最高次方数
poly1d输出预测值

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值