交通流量预测模型得出的预测结果,需要相应的性能评价指标用以对预测结果作出评价。为了有效判断算法模型对交通流量预测的性能表现,需要结合多种指标来衡量预测模型的效果优劣,通常使用均方误差、均方根误差、平均绝对百分误差等指标来衡量。具体误差测量公式简介如下:
0.误差(Error):预测值减去真值。
范围(-∞,+∞)如果预测值高于实际值,那么误差为正,若低于实际值,则误差为负。
1.偏差(Bias):误差的平均值,此处N为预测值或真值的总数。偏差的缺点在于偏差为误差在所有时刻的累加,若某一时刻误差为正值可能会抵消掉另一误差为负值的时刻,因此预测模型可能会得到偏差较小,而预测精度却很低,故只使用偏差不足以对预测精度进行评估。
2.均方误差(Mean Square Error):均方误差是指参数估计值与参数真值之差平方的期望值,是预测误差平方之和的平均数,平方避免了正负误差不能相加的问题,同时对误差进行平方,也加强了数值大的误差在模型训练中的权重。相比于均方根误差少了开根号的运算,故计算速度快。
范围[0,+∞),当预测值与真实值完全吻合时等于0,即完美模型;误差越大,该值越大。
3.均方根误差(Root Mean Square Error):均方根误差是均方误差的算术平方根,具体公式如下:
范围[0,+∞),当预测值与真实值完全吻合时等于0,即完美模型;误差越大,该值越大。
4.平均绝对误差(Mean Absolute Error):观测值与真实值的误差绝对值的平均值。
范围[0,+∞),当预测值与真实值完全吻合时等于0,即完美模型;误差越大,该值越大。
5.平均绝对百分比误差(Mean Absolute Percentage Error):
范围[0,+∞),数值越小,表示模型预测性能越好。
注意:当真实值有数据等于0时,存在分母0除问题,该公式不可用。
6.对称平均绝对百分比误差(Symmetric Mean Absolute Percentage Error):
注意:当真实值有数据等于0时,存在分母0除问题,该公式不可用。
7.均方对数误差(Mean Square Log Error):
8.中位数绝对误差(Median Absolute Error):通过取预测值与实际值之间的所有绝对差值的中值来计算损失。
9.R方值(R2-Score):即决定系数,反映的是自变量对因变量变化的解释程度。
其中,
表示观测值的离散程度,正比于方差。
表示预测值与观测值的残差。
观测值与样本平均值的离差平方和。
在衡量二分类问题的机器学习或深度学习模型性能时,还可查全率(Recall)、查准率(Precision)和F1-score,以及在此基础上混淆矩阵(Confusion Matrix)、受试者工作特征曲线(Receiver Operating Characteristic)等性能度量指标。但交通流量预测并不是传统意义上的二分类问题,并不能将预测结果强行分为正负类,故查全率和查准率等性能度量指标并不适用于交通流量预测模型的评价。