用Python计算点估计预测评价指标(误差指标RMSE、MSE、MAE、MAPE) ，画图展示

阡之尘埃

已于 2022-11-18 18:34:05 修改

阅读量1.8w

点赞数 21

文章标签： python pandas 误差指标拟合优度

于 2022-11-18 17:54:01 首次发布

本文链接：https://blog.csdn.net/weixin_46277779/article/details/127926269

版权

本文介绍了一个用于评估机器学习回归模型的Python函数，该函数能够计算包括MAE、RMSE、MAPE和R2在内的多种评价指标，并展示了如何通过柱状图直观地比较不同模型的表现。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

机器学习的回归问题常用RMSE，MSE, MAE,MAPE等评价指标，还有拟合优度R2。由于每次预测出来的预测值再去和原始数据进行误差评价指标的计算很麻烦，所以这里就直接给出他们五个指标的计算函数。把每次预测出来的值和真实值输入这个函数就可以得到上面这些指标，很方便。然后计算出来放一起还可以画柱状图

先放计算公式：

mse就是rmse的平方，公式是差不多的。

Python计算代码：

import numpy as np
import pandas as pd
from sklearn.metrics import mean_absolute_error
from sklearn.metrics import mean_squared_error,r2_score

def evaluation(y_test, y_predict):
    mae = mean_absolute_error(y_test, y_predict)
    mse = mean_squared_error(y_test, y_predict)
    rmse = np.sqrt(mean_squared_error(y_test, y_predict))
    mape=(abs(y_predict -y_test)/ y_test).mean()
    r_2=r2_score(y_test, y_predict)
    return mae, rmse, mape,r_2  #mse

这个函数就两个参数，一个测试集的真实值，一个预测的预测值，放入就可以计算上面的各种指标了。函数的返回值就是他们的mae，rmse，mape，R2的值。

画图展示

df_allmodel用来装不同模型的预测结果，然后计算四个误差指标。

我这里采用了四个不同的神经网络模型对比，DBN,RNN,CNN,MLP四个模型，df_allmodel每一列就是不同模型的预测结果，行就是不同的样本。

新建df_eval评价数据框，然后循环每一个模型的预测结果，用上面定义的函数计算评价指标，储存到df_eval里面。

df_eval=pd.DataFrame(columns=['MAE','RMSE','MAPE','R2'])
for i,col in enumerate(df_allmodel.columns):
    score=list(evaluation(y_test,np.array(df_allmodel[col])))
    df_eval.loc[col,:]=score
df_eval

然后对df_eval进行画图：

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
plt.rcParams ['font.sans-serif'] ='SimHei'               #显示中文
plt.rcParams ['axes.unicode_minus']=False               #显示负号


bar_width = 0.4
fig, ax = plt.subplots(2,2,figsize=(8,5))
for i,col in enumerate(df_eval.columns):
    n=int(str('22')+str(i+1))
    plt.subplot(n)
    df_col=df_eval[col]
    m =np.arange(len(df_col))
    
    #hatch=['-','/','+','x'],
    plt.bar(x=m,height=df_col.to_numpy(),width=bar_width,color=colors2)
    
    #plt.xlabel('Methods',fontsize=12)
    names=df_col.index
    plt.xticks(range(0, 4),names,fontsize=14)
    
    if col=='R2':
        plt.ylabel(r'$R^{2}$',fontsize=14)
    else:
        plt.ylabel(col,fontsize=14)
plt.tight_layout()
plt.savefig('柱状图.jpg',dpi=512)
plt.show()