作者:黄天元,复旦大学博士在读,热爱数据科学与开源工具(R),致力于利用数据科学迅速积累行业经验优势和科学知识发现,涉猎内容包括但不限于信息计量、机器学习、数据可视化、应用统计建模、知识图谱等,著有《R语言数据高效处理指南》(《R语言数据高效处理指南》(黄天元)【摘要 书评 试读】- 京东图书)。知乎专栏:R语言数据挖掘。邮箱:huang.tian-yuan@qq.com.欢迎合作交流。
模型做好之后,获得的预测值与实际值之间差异的大小,能够用来评价模型的效果。对于数值型因变量的评价方法有很多,包括MASE/MAPE/MAE/RMSE等,个人最常用的是RMSE。
对于每个指标的介绍,这里不做重复工作,可以参照:
1、AI科技大本营:避坑指南:如何选择适当的预测评价指标?| 程序员评测(中文)
2、3.4 Evaluating forecast accuracy | Forecasting: Principles and Practice(英文)
在fpp2包中,可以用accuracy函数来计算模型的准确度:
library(fpp2)
# 抽取目标序列
beer2 <- window(ausbeer,start=1992,end=c(2007,4))
# 分别利用平均值、简单方法、季节简单方法进行拟合,预测时长为10个时间单位
beerfit1 <- meanf(beer2,h=10)
beerfit2 <- rwf(beer2,h=10)
beerfit3 <- snaiv