数学建模更新7（ARCH和GARCH模型）

张张同学！

已于 2022-08-15 19:14:01 修改

阅读量1.2w

点赞数 51

分类专栏：数学建模文章标签：算法数据分析大数据

于 2021-01-26 16:55:23 首次发布

本文链接：https://blog.csdn.net/qq_46126118/article/details/113177222

版权

数学建模专栏收录该内容

52 篇文章

订阅专栏

本文介绍了ARCH与GARCH模型的基本原理及应用流程，通过一个实际案例展示了如何使用这些模型来处理金融时间序列数据，包括数据预处理、模型选择、参数估计及预测等步骤。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一.概述

ARCH模型（Autoregressive conditional heteroskedasticity model）全称“自回归条件异方差模型”
在现代高频金融时间序列中，数据经常出现波动性聚集的特点，但从长期来看数据是平稳的，即长期方差（无条件方差）是定值，但从短期来看方差是不稳定的，我们称这种
异方差为条件异方差。传统的时间序列模型如ARMA模型识别不出来这一特征。

二.ARCH模型优化方向

数据呈现波动聚集性（volatility clustering）长期来看时间序列平稳，短期来看不平稳，存在异方差，这时会使用 $A RC H / G A RC H$ 模型

三.模型

1.总体模型

在这里插入图片描述

2.优化实质

因为加法条件异方差的性质不容易探究，因此我们所说的ARCH模型均是
下面的乘法条件异方差模型。
另外，大家可以看出
实际上ARCH模型是在ARMA模型的基础上提出来的，两者的区别在于扰动项的设置不同，在ARMA模型中扰动项是最简单的白噪声序列

3.ARCH(q)模型

在这里插入图片描述
其实就是改变了扰动项

4.GARCH(p,q)模型

在这里插入图片描述

5.检验GARCH效应

【1】概述

检验 $A RM A$ 模型预测之后

对干扰项检验，若为白噪声，则均值模型估计完全了，否则更 $A RM A$ 重新估计
检验干扰项的平方是否为白噪声，若是则无 $G A RC H$ 效应，否则存在 $G A RC H$ 效应

【2】算法：LM检验

// LM检验：是否存在ARCH误差
reg ressq l.ressq l2.ressq l3.ressq l4.ressq l5.ressq // 将残差平方项对其滞后项回归
gen LM_STAT=e(N)*e(r2) // 计算LM统计量
display LM_STAT // 输出LM统计量
display chiprob(e(df_m),LM_STAT) // 计算p值

在这里插入图片描述

6.何时使用 $A RC H$ 或 $G A RC H$ 模型

在这里插入图片描述

四.一个实例

1.摘要

在这里插入图片描述
就是预测股票趋势

2.数据导入

clear  // 清空变量
* (1) 导入数据并生成时间序列  (*和//都可以用来注释一行)
insheet using "C:\Users\晨沉宸尘\Desktop\上课用的课件和代码(下载后记得解压，所有视频配套的都在里面)\清风数学建模课件和代码（全套下载后请解压)\更新视频的课件和代码\更新7 ARCH和GARCH模型\数据和代码\Bindex.csv"  //导入位于和代码同一文件夹下的csv数据文件
gen datevar = date(date,"YMD")   // 将csv中的变量date转换为stata能识别的时间数据datevar
format datevar %td // 对datevar的展示格式进行转换，转换后以:日月年 显示
label variable datevar "日期"  // 设置datevar的标签为日期，主要用于画图时的展示
tsset datevar   // 定义datevar是一个时间序列数据
gen time=_n  // 定义一个从1到n的time序列，n是观测值的个数，系统自动在后台记录的
tsset time   // 将time这个序列定义为时间序列，后续滞后算子时需要用到

3.画出时间序列图

// 画深成B指的时间序列图
line index datevar   
graph export "深成B指的时间序列图.png", as(png) replace   // 导出图片到本地文件夹

line y,x;
在这里插入图片描述
根据2014年1月至2018年5月共计1064个交易日的收盘价数据，我们做出了B股指数的时序图从图中可以看出，指数序列非平稳，尤其是2015年到2016年之间波动十分剧烈。

4.计算日收益率数据

在这里插入图片描述

// 计算日收益率数据
gen r=100*(index-L.index)/L.index   //（今天的收盘价-昨天的收盘价）/昨天的收盘价   L是lag的缩写

$L . in d e x$ 表示上一次的 $in d e x$

// 对日收益率r进行描述性统计
summarize r

在这里插入图片描述

// 做出日收益率的时间序列图
line r datevar
graph export "深成B指日收益率的时间序列图.png", as(png) replace   // 导出图片到本地文件夹

在这里插入图片描述

5.检验序列r是否为单位根序列（ $A D F$ 检验）

就是为了判断一下用 $A RM A$ 模型还是 $A R I M A$ 模型

// 检验收益率序列r是否为单位根,检验方法是ADF检验(原假设：是单位根序列，备择假设：是平稳序列)
dfuller r
// MacKinnon approximate p-value for Z(t) = 0.0000  p值为0意味着拒绝原假设，所以我们认为r序列平稳

在这里插入图片描述
$A D F$ 检验的原假设：数据是单位根序列，备择假设：数据是平稳序列
$p$ 值为 $0$ 表示拒绝原假设，认为 $r$ 序列平稳
上表结果显示 $p$ 值为0，在99%的置信水平下拒绝原假设，故序列平稳。使用 $A RM A$ 模型

注意：平稳数据建模用ARMA模型（或者ARIMA(p,0,q)），单位根数据建模用ARIMA模型。

6.判断 $A MR A$ 模型的阶数( $A CF$ 图与 $P A CF$ 图)

// 观察acf图与pacf图 ，判断AMRA模型的阶数
ac r,lags(20)   // 自相关系数图，滞后20期
graph export "自相关系数图.png", as(png) replace   // 导出图片到本地文件夹

pac r,lags(20)  // 偏自相关系数图，滞后20期
graph export "偏自相关系数图.png", as(png) replace   // 导出图片到本地文件夹

在这里插入图片描述

在这里插入图片描述
由ACF图和PACF图，3阶和8阶相关系数较为显著，8阶之后的显著可能由于误差导致，不予考虑。 (1阶虽然显著，但其包含的信息太少，我们对高频数据进行建模时往往不考虑)
因此，为保证模型选取的准确性，我们拟合了四个模型并从中选取最
优的模型。
其中
$M o d e l 1 ： A RM A （ 3, 3)$ ； $M o d e l 2 ： A RM A （ 8, 8)$ ；
$M o d e l 3 ： A RM A （ 3, 8 ）$ ； $M o d e l 4 ： A RM A （ 8, 3 ）$ 。

7.利用 $A I C$ 和 $B I C$ 选择模型

太多的滞后项会增加预测的误差，太少的滞后项又会遗失部分相关信息。经验和理论知识通常是用来决定滞后项阶数的最好方式，然而，依然存在着一些准则帮助我们确定滞后的阶数。为了确定哪个模型拟合效果最好，我们分别估计出了这四种模型，并给出了对应的 $A I C$ 和 $B I C$ 值，我们认为AIC与BIC值较小，模型拟合效果较好。

在这里插入图片描述

我们根据AIC和BIC准则可知，这四个模型中应选取Model1，即ARMA（3,3）模型。此时，AIC值和BIC值的平均值最小。

8.ARMA（3,3）模型的估计结果

在这里插入图片描述
建立

9.残差序列的分布直方图

// ARIMA(3,0,3)模型的AIC值和BIC值的平均值最小，所以下面我们使用这个模型进行估计 
arima r,arima(3,0,3)

// 得到残差的预测值并生成残差分布直方图图
predict residess, residuals   // 保存残差
hist residess,norm freq  // norm freq表示加上标准正态分布的概率密度函数
graph export "残差分布直方图.png", as(png) replace   // 导出图片到本地文件夹

在这里插入图片描述

10.检验残差是否为白噪声

接着，我们使用Ljung‐Box Q检验，来检验ARMA模型的有效性，检验结果为下表所示：


// 检验残差是否为白噪声序列，检验方法为Q检验：原假设是白噪声，备择假设不是白噪声
wntestq residess, lag(12)   // 对残差序列进行白噪声检验
// 生成残差的平方，并进行Q检验
gen ressq = residess^2   // 生成残差平方序列ressq
wntestq ressq, lag(12) // 对残差平方序列ressq进行白噪声检验

在这里插入图片描述

滞后12项的检验值的P值大于0.05，在5%的显著性水平下并不能拒绝原假设。故可以认为通过白噪声检验，即我们认为回归得到的残差不存在较明显的相关性，因此模型有效性较好。

11.对残差的平方进行LM检验（检验是否存在 $G A RC H$ 误差）

在这里插入图片描述

// LM检验：是否存在ARCH误差
reg ressq l.ressq l2.ressq l3.ressq l4.ressq l5.ressq  // 将残差平方项对其滞后项回归
gen LM_STAT=e(N)*e(r2) // 计算LM统计量
display LM_STAT  // 输出LM统计量
display chiprob(e(df_m),LM_STAT) // 计算p值

在这里插入图片描述

12.利用AIC、BIC选择合适的模型

// 利用AIC BIC选择合适的模型进行估计 
// 注意：扰动项的分布在金融数据中常服从t分布
// 正态分布下GARCH(1,1)估计
arch r,arima(3 0 3) arch(1) garch(1)
estat ic
// t分布下GARCH(1,1)估计
arch r,arima(3 0 3) arch(1) garch(1) distribution(t 3)  // 自由度为3的t分布
estat ic
// 正态分布下GARCH(2,2)估计
arch r,arima(3 0 3) arch(2) garch(2)
estat ic
// t分布下GARCH(2,2)估计
arch r,arima(3 0 3) arch(2) garch(2) distribution(t 3)
estat ic

在这里插入图片描述

相加平均找个最小
通过比较AIC和BIC，最终我们选择使用带有GARCH(1,1)且vt服从t分布的扰动项的ARMA(3,3)模型进行估计的

13.预测结果

// 得到拟合结果，并进行预测
arch r,arima(3 0 3) arch(1) garch(1) distribution(t 3)
tsappend ,add(10)  // 将时间延长10期
predict result // 对数据进行预测
tsline result r, legend(label(1 "预测值")  label(2 "真实值"))   // 绘制拟合图
graph export "预测结果图.png", as(png) replace   // 导出图片到本地文件夹