交通流量预测评价指标

交通流量预测模型得出的预测结果,需要相应的性能评价指标用以对预测结果作出评价。为了有效判断算法模型对交通流量预测的性能表现,需要结合多种指标来衡量预测模型的效果优劣,通常使用均方误差、均方根误差、平均绝对百分误差等指标来衡量。具体误差测量公式简介如下:

0.误差(Error):预测值减去真值。

Error=observed_{t}-predictedt_{t}

范围(-∞,+∞)如果预测值高于实际值,那么误差为正,若低于实际值,则误差为负。

      

1.偏差(Bias):误差的平均值,此处N为预测值或真值的总数。偏差的缺点在于偏差为误差在所有时刻的累加,若某一时刻误差为正值可能会抵消掉另一误差为负值的时刻,因此预测模型可能会得到偏差较小,而预测精度却很低,故只使用偏差不足以对预测精度进行评估。

Bias=\frac{1}N\sum_{t=0}^{N} (observed_{t}-predicted_{t})

 

2.均方误差(Mean Square Error):均方误差是指参数估计值与参数真值之差平方的期望值,是预测误差平方之和的平均数,平方避免了正负误差不能相加的问题,同时对误差进行平方,也加强了数值大的误差在模型训练中的权重。相比于均方根误差少了开根号的运算,故计算速度快。

MSE=\frac{1}{}N\sum_{t=0}^{N}(observed_{}t-predicted_{}t)^{}2

范围[0,+∞),当预测值与真实值完全吻合时等于0,即完美模型;误差越大,该值越大。

      

3.均方根误差(Root Mean Square Error):均方根误差是均方误差的算术平方根,具体公式如下:

 

RMSE=\sqrt{\frac{1}{}N\sum_{t=0}^{}N(observed_{}t-predicted_{}t)^{}2}

范围[0,+∞),当预测值与真实值完全吻合时等于0,即完美模型;误差越大,该值越大。

      

4.平均绝对误差(Mean Absolute Error):观测值与真实值的误差绝对值的平均值。

MAE=\frac{1}{}N\sum_{t=0}^{}N|observed_{}t-predicted_{}t|

范围[0,+∞),当预测值与真实值完全吻合时等于0,即完美模型;误差越大,该值越大。

 

5.平均绝对百分比误差(Mean Absolute Percentage Error):

MAPE=\frac{1}{N}\sum_{t=0}^{N}|\frac{observed_{}t-predicted_{}t}{observed_{}t}|

范围[0,+∞),数值越小,表示模型预测性能越好。

注意:当真实值有数据等于0时,存在分母0除问题,该公式不可用。

 

6.对称平均绝对百分比误差(Symmetric Mean Absolute Percentage Error):

SMAPE=\frac{1}{N}\sum_{t=0}^{N}\frac{|observed_{}t-predicted_{}t|}{(|observed_{}t|+|predicted_{}t|)/2}

注意:当真实值有数据等于0时,存在分母0除问题,该公式不可用。

 

7.均方对数误差(Mean Square Log Error):

MSLE=\frac{1}{}N\sum_{t=0}^{}N)[log(1+observed_{}t)-log(1+predicted_{}t)]^{}2

 

8.中位数绝对误差(Median Absolute Error):通过取预测值与实际值之间的所有绝对差值的中值来计算损失。

MedAE=median(|observed_{}0-predicted_{}0|...|observed_{}n-predicted_{}n|)

 

9.R方值(R2-Score):即决定系数,反映的是自变量对因变量变化的解释程度。

R_{}2=1-\frac{\sum_{t=0}^{N}(observed_{}t-predicted_{}t)^{}2}{\sum_{t=0}^{N}(observed_{}t-mean)^{}2}=\frac{ESS}{TSS}=1-\frac{RSS}{TSS}

其中,

TSS(Total Sum of Squares)=\sum_{t=0}^{N}(observed_{}t-mean)^{}2

       表示观测值的离散程度,正比于方差。

      RSS(Residual Sum of Squares)=\sum_{t=0}^{N}(observed_{}t-predicted_{}t)^{}2

表示预测值与观测值的残差。

ESS(Explained Sum of Squares)=\sum_{t=0}^{N}(predicted_{}t-mean)^{}2

观测值与样本平均值的离差平方和。

 

在衡量二分类问题的机器学习或深度学习模型性能时,还可查全率(Recall)、查准率(Precision)和F1-score,以及在此基础上混淆矩阵(Confusion Matrix)、受试者工作特征曲线(Receiver Operating Characteristic)等性能度量指标。但交通流量预测并不是传统意义上的二分类问题,并不能将预测结果强行分为正负类,故查全率和查准率等性能度量指标并不适用于交通流量预测模型的评价。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值