机器学习-模型决定系数

决定系数

决定系数反应了y的波动有多少百分比能被x的波动所描述,即表征依变数Y的变异中有多少百分比,可由控制的自变数X来解释.

表达式:R2=SSR/SST=1-SSE/SST

其中:SST=SSR+SSE,SST(total sum of squares)为总平方和,SSR(regression sum of squares)为回归平方和,SSE(error sum of squares) 为残差平方和。

回归平方和:SSR(Sum of Squares forregression) = ESS (explained sum of squares)

残差平方和:SSE(Sum of Squares for Error) = RSS(residual sum of squares)

总离差平方和:SST(Sum of Squares fortotal) = TSS(total sum of squares)

SSE+SSR=SST RSS+ESS=TSS

意义:决定系数越大,自变量对因变量的解释程度越高,自变量引起的变动占总变动的百分比高。

相关系数

皮尔逊相关系数(Pearson Correlation Coefficient)

1)衡量两个值线性相关强度的量;

2)取值范围:[-1,1]

正向相关:>0,负向相关:<0,无相关性:=0

3)定义


决定系数与相关系数的关系

在一元线性相关情况下,决定系数是相关系数的平方。 相关系数是用来描述两个变量之间的线性关系的,但决定系数的适用范围更广,可以用于描述非线性或者有两个及两个以上自变量的相关关系。

决定系数的意义是变量A可以解释变量B方差的多少。 
因此,相关系数的意义(为正的情况)就是变量A可以解释变量B标准差的多少。 
更直接的解释是,由于变量A的变动,变量B增加了C,而这C中有r的比例是因为变量A的变动造成的。 
举例: 
比如模型中责任心对工作绩效一般有10%的预测力,也就是说决定系数是0.1。因此,推论到上述直接的解释上,也就意味着某人工作绩效量增加了C,这C中有大约32%是因为某人责任心的增加而增加的。 
  • 2
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值