最近我们被客户要求撰写关于时间序列的研究报告,包括一些图形和统计输出。
当ARIMA模型包括其它时间序列作为输入变量时,被称为传递函数模型(transfer function model)、多变量时间序列模型(multivariate time series model)、ARIMAX模型或Box-Tiao模型。传递函数模型是ARIMA模型的自然推广,Pankratz统称这种包含其它时间序列作为输入变量的ARIMA模型为动态回归。
相关视频:在Python和R语言中建立EWMA,ARIMA模型预测时间序列
用于预测的 Arima
加载相关包和数据
bata<-read.csv
colnames(bata)
bata<-bata[order(as.Date,]
bata<-bata[order(as.Date,]
bata$workda<-as.factor
head(bata)
将数据划分为训练集和测试集
#ARIMA 编程开始
## 75% 的样本量
smsize <- floor(0.95 * nrow)
print(smze)
## 设置种子可重现
set.seed(123)
traid <- sample
trn <- bata[1:smize, ]
tet <- baata[smp_size+1:nrow, ]
tet<-na.omit
创建预测矩阵
xreg <- cbind(as_workday=model.matrix,
Temp,
Humid,
Winds
)
# 删除截距
xg <- xg[,-1]
# 重命名列
colnames<- c("Aldays","Tep","Humty","Wined")
#为测试数据创建相同的
xrg1 <- cbind
# 删除截距
xreg1 <- xre1[,-1]
# 重命名列
colnames <- c("Aays","Te","uiiy","Wnsed")
为 arima 预测的训练数据创建时间序列变量
Cont <- ts
推论:由于数据是每天的,频率为 365,开始日期为 2016-7-7
用季节性拟合 ARIMA 模型
Fo_aes<-forecast
计算测试数据集 MSE
mean((tt - Finlues)^2)
在去除季节性之前绘制预测值
library(ggplot2)
无季节性拟合 ARIMA
去除季节性数据集和绘图
decata = decompos
### 查找去季节数据的 ARIMAX 模型
moesea
Foecs<-forecast
去除季节性后绘制预测值
library(ggplot2)
plot(Co, series="Data") +
autolayer+
autolayer
均方误差分量
mean((tount - Fis_des)^2)
通过采用滞后变量的输出以及滞后 1,2 的输入进行动态回归
x<-train[order,]
ti_ag <- x %>%
mutate
x1<-test
testg <- x1 %>%
mutate
使用动态滞后变量的 OLS 回归
mlm <- lm
推论:仅保留 P 值 <0.05 的重要变量并删除其他变量
仅保留重要变量的情况下重新创建 OLS 回归
Myal <-lm
summary(Myal )
在测试数据上预测相同以计算 MSE
prynm<-predict
# 动态回归的均方误差
mean((teunt - tPrecd)^2)
绘制预测与实际
plot
abline