【数据分析】“模型预测”和“实测数据”的误差分析指标

大家在做数据分析时候,通常会用到实测和计算值的比较,而这种误差分析的指标选取尤其关键,本文就为大家总结常用的指标及其细节,并附带领域经典参考文献,希望大家多多关注点赞支持。


一、基础误差指标


1. 均方误差(MSE)
   - 公式:
   - 特点:对异常值敏感,量纲为原数据平方
   - 参考文献:Hyndman & Koehler (2006), *IJF*

2. 均方根误差(RMSE)
   - 公式:
   - 特点:与原始数据同量纲,常用于物理科学
   - 参考文献:Willmott & Matsuura (2005), *Climate Research*

3. 平均绝对误差(MAE)
   - 公式:
   - 特点:鲁棒性强,适用于含噪声数据
   - 参考文献:Chai & Draxler (2014), *Atmospheric Environment*

4. 平均绝对百分比误差(MAPE)
   - 公式:
   - 局限:当真实值含零时失效
   - 参考文献:Armstrong (2001), *Principles of Forecasting*

二、无量纲指标


5. 决定系数(R²)
   - 公式:
   - 解释:反映模型解释方差的比例
   - 参考文献:Nagelkerke (1991), *Biometrika*

6. 纳什-萨特克利夫效率系数(NSE)
   - 公式:
   - 应用:水文模型评估标准指标
   - 参考文献:Nash & Sutcliffe (1970), *Journal of Hydrology*

7. 对称MAPE(sMAPE)
   - 公式:
   - 改进:解决MAPE不对称问题
   - 参考文献:Chen et al. (2017), *Neurocomputing*

三、高级分析指标


8. Bland-Altman分析
   - 方法:计算平均偏差及其95%一致性界限
   - 输出:偏差-均值图(医学仪器验证金标准)
   - 参考文献:Bland & Altman (1986), *The Lancet*

9. Theil’s U统计量
   - 公式:
   - 解释:0-1范围,0表示完美预测
   - 参考文献:Theil (1966), *Applied Economic Forecasting*

10. Kolmogorov-Smirnov检验(KS)
    - 方法:比较预测与实测数据的累积分布函数
    - 应用:金融风险模型验证
    - 参考文献:Massey (1951), *JASA*

四、领域专用指标


11. 克拉克误差网格(CEG)
    - 分类:将误差分为临床可接受(A/B区)和危险区(C/D/E)
    - 应用:血糖监测设备评估
    - 参考文献:Clarke et al. (1987), *Diabetes Care*

12. 拟合优度指数(GFI)
    - 公式:
    - 领域:结构方程模型验证
    - 参考文献:Jöreskog & Sörbom (1996), *LISREL手册*

五、误差分解技术


13. MSE分解(偏差-方差-协方差)
    - 分解式:
    - 用途:诊断模型误差来源
    - 参考文献:Geman et al. (1992), *Neural Computation*

14. 误差谱分析
    - 方法:通过傅里叶变换分析误差频率特征
    - 应用:时间序列模型诊断
    - 参考文献:Box et al. (2015), *Time Series Analysis*

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小童123

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值