机器学习—确定系数R2
定义
评价数据集在线性模型中可预测的比例
公式
如何界定可预测的数据,和不可预测的数据?可以从统计学角度出发衡量
假定一个数据集有n个值(y1,yn),每个值匹配一个预测值,则有n个预测值(f1,fn)
可解释方差
统计预测值在平均线周围的波动
残差平方和
统计预测值与标签值之间的差异
总平方和
统计数据集自身的平方和
确定系数R2
Code
sklearn.metrics.r2_score(y_true, y_pred, *, sample_weight=None, multioutput='uniform_average')
y_true:数据标签值
y_pred:数据预测值
注意:y_true和y_pred要是数组,且形状一样