sas应用入门(7.1)—— 时间序列的预处理(精)

一、平稳时间序列的意义

  1. 时间序列数据结构的特殊性

    可列多个随机变量,而每个变量只有一个样本观察值

  2. 平稳性的重大意义

    极大地减少了随机变量的个数,并增加了待估变量的样本容量
    极大地简化了时序分析的难度,同时也提高了对特征统计量的估计精度


二、平稳性的检验(图检验方法)

  • 时序图检验
    根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势及周期特征
  • 自相关图检验
    平稳序列通常具有短期相关性。该性质用自相关系数来描述就是随着延迟期数的增加平稳序列的自相关系数会很快地衰减向零

三、白噪声序列的性质

  • 纯随机性

各序列值之间没有任何相关关系,即为 “没有记忆”的序列

  • 方差齐性

根据马尔可夫定理,只有方差齐性假定成立时,用最小二乘法得到的未知参数估计值才是准确的、有效的

四、纯随机性检验

  1. 检验原理

  2. 假设条件
    原假设:延迟期数小于或等于 期的序列值之间相互独立
    H 0 : {H_0: } H0: ρ 1 = {\rho_1=} ρ1= ρ 2 = {\rho_2=} ρ2=…… = ρ m {=\rho_m} =ρm ∀ {\forall} m ⩾ 1 {m\geqslant1} m1
    备择假设:延迟期数小于或等于 期的序列值之间有相关性
    H 1 : {H_1: } H1: 至少存在某个 ρ k ≠ 0 {\rho_k\neq0} ρk=0 ∀ {\forall} m ⩾ 0 {m\geqslant0} m0, k ⩽ m {k\leqslant m} km

  3. 检验统计量

  4. 判别原则

拒绝原假设
当检验统计量大于 分位点,或该统计量的P值小于 时,则可以以 的置信水平拒绝原假设,认为该序列为非白噪声序列
接受原假设
当检验统计量小于 分位点,或该统计量的P值大于 时,则认为在 的置信水平下无法拒绝原假设,即不能显著拒绝序列为纯随机序列的假定

五、案例分析

序列预测
某车站1993-1997年各月的列车运行数量数据如下表,试用时间序列建立合适的模型。并预测1998年1月的数值
1196.8 1181.3 1222.6 1229.3 1221.5 1148.4 1250.2 1174.4 1234.5 1209.7
1206.5 1204.0 1234.1 1146.0 1304.9 1221.9 1244.1 1194.4 1281.5 1277.3
1238.9 1267.5 1200.9 1245.5 1249.9 1220.1 1267.4 1182.3 1221.7 1178.1
1261.6 1274.5 1196.4 1222.6 1174.7 1212.6 1215.0 1191.0 1179.0 1224.0
1183.0 1288.0 1274.0 1218.0 1263.0 1205.0 1210.0 1243.0 1266.0 1200.0
1306.0 1209.0 1248.0 1208.0 1231.0 1244.0 1296.0 1221.0 1287.0 1191.0

平稳性检验:

  1. 代码程序
data a;
input lieche@@;/*lieche为变量名*/
month=intnx('month','1jan1993'd,_n_-1);/*intnx间隔取时间变量*/
format month date.;/*月份格式*/
/*format month data.||format year year4.*/
cards;
1196.8	1181.3	1222.6	1229.3	1221.5   1148.4	1250.2	1174.4	1234.5	1209.7
1206.5	1204.0	1234.1	1146.0	1304.9   1221.9	1244.1	1194.4	1281.5	1277.3
1238.9	1267.5	1200.9	1245.5	1249.9   1220.1	1267.4	1182.3	1221.7	1178.1
1261.6	1274.5	1196.4	1222.6	1174.7   1212.6	1215.0	1191.0	1179.0	1224.0
1183.0	1288.0	1274.0	1218.0	1263.0   1205.0	1210.0	1243.0	1266.0	1200.0
1306.0	1209.0	1248.0	1208.0	1231.0   1244.0	1296.0	1221.0	1287.0	1191.0 
;
run ;
proc gplot;
/*画图*/
plot lieche*month;
/*纵轴为lieche,横轴为mouth*/
symbol v=square  i=join c = red;
/*图形特征,v表示点的形状,i表示图形连线的情况,c代表颜色*/
proc arima data = a; 
/*调用arima模块*/
identify var=lieche nlag = 22;
/*延迟阶数为22阶*/
run;
  1. 结果分析
    自相关图
    由此自相关图可看出,自相关系数很快的衰减向0,且始终控制在2倍范围内可以认为该序列为平稳序列

时序图
此车站列车运行数量数据在一个常数值附近随机波动,而且波动范围有界,无明显趋势及周期特征,基本可以视序列为平稳序列

进行随机性检验:
分析结果中The ARIMA Procedure部分:
这里写图片描述

由于统计量P值均大于0.05,则认为在0.05的显著水平下,无法拒绝原假设,即不能显著拒绝序列为纯随机序列的假定,因而认为此车站列车运行数量为纯随机波动序列,各序列之间没有任何行相关关系,即为无记忆序列该车站列车运行数量前后两年并无大的联系,也就是实说,我们很难根据历史信息预测未来年份此车站列车运行数量,故,该平稳序列不值得继续分析下去,对该序列分析到此结束。

**分析:**随机性检验可以一票否决,一旦不能拒绝纯随机的原假设,则课判定该序列无效;而图检验方法带有主观,其结果只能用于参考。

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值