项目学习笔记1 R^2

R^2:决定系数。经常用来衡量回归分析的好坏。

  对于一组数据,如果他们按照一个规则来计算,会有非常确定的函数表达式。比如银行存款,规则已然确定,函数自然也确定。
 但是实际并没有这么确定的函数关系式,往往是这些数据遵循一定的规律,也就是相关关系。不是确定的关系,但是也不是没有关系。回归分析,就是对相关关系进行量化分析的手段。这时候就需要有个东西来衡量回归分析结果的好坏啦,就是R^2.
  直观感受: 预测值y帽和实际的yi的差可以代表预测的好坏,如果相等那就预测的完美咧。但是呢,这个值有可能是负数,会正负抵消,所以我们采用平方消去正负的影响。Sigma(y帽-yi)^2,这个就叫做SSE,残差平方和,代表预测值和实际值的偏离程度,自然越小越好。
 但是又有一个问题,这个是绝对误差。如果每个数都很大,最后的求和也会很大;比起数值很小的数据的误差会大很多,但是实际不一定效果更差。比如天文学中的单位动辄几万几十万,这样偏差的数值会很大,但是未必效果很差。于是,我们自然地想到了用比例来计算。
  Sigma(yi - yav)^2,用实际值与平均值的平方和作为分母,这个是粗暴计算的偏差程度。因为用平均值就默认是线性关系了,现实生活和建模时极少有完完全全的线性关系。这个呢,就叫做SST.
  于是,R^2 = 1-SSE/SST就产生了。如果粗暴计算的偏差程度是100,而我们的预测是95,这样比起粗暴计算就降低5%的偏差程度,R^2就是5%。而如果预测的偏差程度是5,这样比起粗暴计算就降低了95%的偏差程度,效果就很好了。
  不过,单看R^2也不能完全说明问题,还存在过拟合的情况。而且这个R ^2是与粗暴的用平均值估计相比的,不能完全说明问题,如果数据过少不具有普适性。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值