R方是统计学里常用的统计量,在不同任务模型下的解读和用途不一,有时候会出现误用情况。本文总结了对R方的理解和用法,遵循“从一般到特殊”的思路,先讲一般回归模型中的R方,再讲线性回归模型里的R方。"一般"回归模型包括线性模型,随机森林,神经网络等。
- R方的定义
R方的名字是coefficient of determination,另一个名字是Nash–Sutcliffe model efficiency coefficient。给定一系列真值
和对应的预测值
,R方的定义为
R方的含义是,预测值解释了
变量的方差的多大比例,衡量的是预测值对于真值的拟合好坏程度。通俗理解,假定
的方差为1个单位,则R方表示"使用该模型之后,
的残差的方差减少了多少"。比如R方等于0.8,则使用该模型之后残差的方差为原始