我们在做逻辑回归或是其他线性模型的时候,经常会遇到一个模型衡量指标叫做
,网上很多一个普遍的解释是:
表达了2个变量间关系的解释程度百分比程度 / 你的你和曲线对于模型variance的减少百分比
用一个例子来理解一下。下图有蓝色的样本分布点,红线是我们的拟合曲线,灰线是平均值曲线
R方的公式是:
上图中分母和分子的左侧从数字上,可以理解为样本点到均值线的差平方和。分子的右侧代表预测结果与样本均值差的平方和。根据图像,我们其实可以将:
分子理解成:
样本标签本身的var - 将