基础知识查缺补漏：RMSE和MSE

最新推荐文章于 2025-04-28 09:38:40 发布

缘友一世

最新推荐文章于 2025-04-28 09:38:40 发布

阅读量1k

点赞数 10

分类专栏：机器学习文章标签： python 人工智能机器学习

本文链接：https://blog.csdn.net/yang2330648064/article/details/147399294

版权

机器学习专栏收录该内容

12 篇文章

订阅专栏

文章目录

均方误差 (MSE)
均方根误差 (RMSE)
对数变换后的 MSE 和 RMSE
还原后的 MSE 和 RMSE
总结

RMSE（均方根误差）和 MSE（均方误差）是常用的模型评估指标，用于衡量模型预测值与真实值之间的差异。
MSE 和 RMSE 被用来评估模型在对数变换后的目标变量和还原后的目标变量上的表现。

均方误差 (MSE)

定义：均方误差是预测值与真实值之间差异的平方的平均值。

公式：
$\text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2$

其中：

$n$ 是样本数量。
$y_i$ 是真实值。
$\hat{y}_i$ 是预测值。

解释：

MSE 通过平方误差来惩罚较大的预测误差，因此对较大的误差更加敏感。
MSE 的单位与原始数据的单位的平方相同，这有时会使得解释起来不太直观。

均方根误差 (RMSE)

定义：均方根误差是均方误差的平方根。

公式：
$\text{RMSE} = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2}$

其中：

$n$ 是样本数量。
$y_i$ 是真实值。
$\hat{y}_i$ 是预测值。

解释：

RMSE 是 MSE 的平方根，因此它与原始数据的单位相同，这使得 RMSE 更加直观和易于解释。
RMSE 也对较大的预测误差更加敏感，因为它对误差进行了开平方处理。

对数变换后的 MSE 和 RMSE

# 计算训练集上对数变换后的真实值与预测值之间的均方误差（MSE）
mse_train_log = mean_squared_error(y_true=np.log1p(y_train), y_pred=reg.predict(x_train_scaled))
print(f"训练集上对数变换后的 MSE: {mse_train_log}")

# 计算测试集上对数变换后的真实值与预测值之间的均方误差（MSE）
mse_test_log = mean_squared_error(y_true=np.log1p(y_test), y_pred=y_predict)
print(f"测试集上对数变换后的 MSE: {mse_test_log}")

# 计算训练集上对数变换后的真实值与预测值之间的均方根误差（RMSE）
rmse_train_log = np.sqrt(mean_squared_error(y_true=np.log1p(y_train), y_pred=reg.predict(x_train_scaled)))
print(f"训练集上对数变换后的 RMSE: {rmse_train_log}")

# 计算测试集上对数变换后的真实值与预测值之间的均方根误差（RMSE）
rmse_test_log = np.sqrt(mean_squared_error(y_true=np.log1p(y_test), y_pred=y_predict))
print(f"测试集上对数变换后的 RMSE: {rmse_test_log}")

还原后的 MSE 和 RMSE

# 计算训练集上真实值与预测值（经过指数变换还原）之间的均方根误差（RMSE）
rmse_train_exp = np.sqrt(mean_squared_error(y_true=y_train, y_pred=np.exp(reg.predict(x_train_scaled))))
print(f"训练集上还原后的 RMSE: {rmse_train_exp}")

# 计算测试集上真实值与预测值（经过指数变换还原）之间的均方根误差（RMSE）
rmse_test_exp = np.sqrt(mean_squared_error(y_true=y_test, y_pred=np.exp(y_predict)))
print(f"测试集上还原后的 RMSE: {rmse_test_exp}")