第四章 预测方法概述
4.1基于模型的方法和数据驱动方法
基于模型的方法引用统计学,数学或其他学科的理论模型来拟合时间序列数据。训练集数据用来估计模型的参数,然后用得到的模型来进行预测。
数据驱动的方法通过算法来寻找数据中蕴含的规律或者模式。模型驱动方法需要满足一些前提条件。
数据驱动方法的优点之一是易于进行自动化预测。但是需要足够多数据进行学习,较长的时间序列。
模型方法是估计全局趋势,数据驱动方法可以通过设置记忆的长度来适应时间序列的变化,常用于找寻局部规律。
4.2外推法、计量模型和外部信息
外推预测是基于时间序列的历史数据进行预测,涉及到多个相关的时间序列预测时,大部分方法是用这些序列各自的历史数据单独进行预测,忽略相关性。
计量模型从因果关系角度对序列间的相关关系建模,吧一个活多个外部序列作为输入。另一种方法是获取序列之间的相关关系直接用于预测模型中称之为多元时间序列分析。
第三类是启发式地应用于所分析的时间序列相关的外部信息。如研究口红销售预测经济情况。
注意预测方法只能够应用于进行预测时所有可以获得的数据。
4.3 人工预测和自动预测
4.4 组合方法
两水平组合方法:用第一个预测法预测原始时间序列,得到未来预测值,用第二个预测法应用于第一个方法得到的预测误差,预测出未来的预测误差。最后第二个方法预测出的未来预测误差对第一个预测方法的预测值修正。
合奏方法:同一个时间序列用不同方法预测,每种一个未来预测值,然后平均。
如果两个预测模型有差不多的RMSE,直接用这两个的平均值比试图开发一个兼具两者优点的单一模型要快速高效。若RMSE相差很多,则肯定找到一个两者的线性组合,是的RMSE提高。
第三种是应用不同的时间序列(来源不同)来描述所研究的对象,然后对不同序列的预测结果进行平均。
第五章基于回归的预测方法
5.1 趋势模型分析
1.线性趋势指时间序列的取值随着时间裱花呈现线性增加或减少的趋势。
Yt=b0+b1*t+e;yt是t时刻的预测值,e是模型误差,b0,b1,e分别对应时间序列的水平,趋势和噪声。此模型不考虑季节性。
实践:xlminer选择:预测-》多元线性回归。
可以通过检验残差时间序列来判定模型是否合适。
2.指数趋势是取值随着时间变化呈现指数增长或减少。
logYt=b0+b1*t+e 该模型误差是logy-logy',如果与线性模型比较误差,则需要转换标度。
3.函数:多项式
Yt=b0+b1*t+b2*t*t+e二次多项式模型。
4.只要时间序列的趋势有数字表达,就可以拟合出。但前提是该趋势适用于现有时间序列的时间区间和要预测的区间,要注意避免过度拟合
5.2 带有季节性趋势的模型
5.3 同时带有趋势性和季节性模型
5.4 由模型预测
5.5 AR和ARIMA模型
5.6 不规则的趋势模式