如果你像我一样,你可能会在你的回归问题中使用R平方(R平方)、均方根误差(RMSE)和均方根误差(MAE)评估指标,而不用考虑太多。
尽管它们都是通用的度量标准,但在什么时候使用哪一个并不明显。
R方(R²)
R²代表模型所解释的方差所占的比例。
R²是一个相对度量,所以您可以使用它来与在相同数据上训练的其他模型进行比较。你可以用它来大致了解一个模型的性能。
我们看看R轴是怎么计算的。向前!➡️
这是一种表示R的方法。
1 - (SSE/SST)
SSE是误差的平方和;实际值与预测值之差的平方和。
SST为总平方和(有时用TSS表示);实际值与实际均值之差的平方之和实际值与实际均值之差的平方之和。
用更数学的符号:
1 - (∑(y - ŷ)² / ∑(y - y̅)²)
下面是代码的样子——改编自scikit-learn,主要的Python机器学习库。
numerator = ((y_true - y_pred) ** 2).sum()
denominator = ((y_true - np.average(y_true)) ** 2).sum()r2_score = 1 - (numerator / denominator)
用文字描述:
分子:
用实际的y值减去预测值求平方再求和
分母
用每个y值减去实际y值的均值求平方再求和
1 -分子/分母就是R方
R² 是scikit-learn回归问题的默认度量。如果你想显式地使用它,你可以导入它,然后像这样使用:
from sklearn.metrics
import r2_score
r2_score(y_true, y_pred)<