预测、拟合方法门目繁多,包括定性预测和定量预测,此篇主要归纳定量预测。
时间序列分析
时序预测法
具体分为:
简单时序平均数法:
也称算术平均法。即把若干历史时期的统计数值作为观察值,求出算术平均数作为下期预测值。这种方法基于下列假设:“过去这样,今后也将这样”,把近期和远期数据等同化和平均化,因此只能适用于事物变化不大的趋势预测。如果事物呈现某种上升或下降的趋势,就不宜采用此法。
就是把各个时期的历史数据按近期和远期影响程度进行加权,求出平均值,作为下期预测值。
就是相继移动计算若干时期的算术平均数作为下期预测值。
即将简单移动平均数进行加权计算。在确定权数时,近期观察值的权数应该大些,远期观察值的权数应该小些。
上述几种方法虽然简便,能迅速求出预测值,但由于没有考虑整个社会经济发展的新动向和其他因素的影响,所以准确性较差。应根据新的情况,对预测结果作必要的修正。
即根据历史资料的上期实际数和预测值,用指数加权的办法进行预测。此法实质是由内加权移动平均法演变而来的一种方法,优点是只要有上期实际数和上期预测值,就可计算下期的预测值,这样可以节省很多数据和处理数据的时间,减少数据的存储量,方法简便。是国外广泛使用的一种短期预测方法。
根据经济事物每年重复出现的周期性季节变动指数,预测其季节性变动趋势。推算季节性指数可采用不同的方法,常用的方法有季(月)别平均法和移动平均法两种:a.季(月)别平均法。就是把各年度的数值分季(或月)加以平均,除以各年季(或月)的总平均数,得出各季(月)指数。这种方法可以用来分析生产、销售、原材料储备、预计资金周转需要量等方面的经济事物的季节性变动;b.移动平均法。即应用移动平均数计算比例求典型季节指数。
时序预测模型
Winters Method—Additive模型
Winters Method—Muhiplicative模型
StepAR—逐步自回归模型
ARMA—自回归滑动平均模型
ARIMA—自回归积分滑动平均模型
ARCH—自回归条件异方差模型
因果关系分析
-
插值拟合法
回归分析法
首先进行主成分分析,做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(F1)越大,表示F1包含的信息越多。因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来P个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现在F2中,用数学语言表达就是要求Cov(F1, F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,……,第P个主成分。
一元线性回归分析——只存在一个自变量和一个因变量,并且二者关系可用直线近似表示。
一元非线性回归分析——只存在一个自变量和一个因变量,且二者存在非线性关系,一般采用适当的变量替换,使两个新变量成线性回归,再应用最小二乘法求出新变量的线性回归方程,最后还原到原来的变量,即可得到所要求的一元非线性回归方程。即化曲为直的回归问题。
多重线性回归分析——回归分析中包括两个或两个以上的自变量,且自变量之间存在线性相关。参数估计通过最小二乘法。
多元线性回归分析——存在多个自变量和多个(或一个)因变量,且它们之间存在线性关系,参数估计为最小二乘法。
多元非线性回归分析——存在多个自变量和多个(或一个)因变量,且它们之间存在非线性关系,一般通过化曲为直求解回归方程,常用的非线性模型有:
1)多项式模型:
对方程中的变量作如下变换
则原方程变为
就可用线性模型的方法处理。
2)指数模型:
方程两边取对数得:
令
则可得线性方程
3)幂函数模型:
方程两边取对数得
令
则幂函数模型就变为线性模型
4)成长曲线模型
成长曲线模型在经济、教育和心理研究中都非常有用,其数学表达式为:
令
它就转化为线性模型:
其他回归方法
最后必须指出:各种回归方程的适用范围,一般只局限于原来观测数据的变动范围,而不能随意外推.在必须进行外推的情况下,也要十分小心,一定要在实际中对所得结果进行检验,看是否合理.常用的检验方法有:
拟合优度检验:记TTS为总离差平方和,ESS为回归平方和,RSS为剩余平方和;则R^2=ESS/TSS。
方程的显著性检验(F检验):即检验模型中回归系数bj是否显著不为零,可提出如下原假设与备择假设h0和h1。h0为bj的系数全为零,h1为bj的系数不全为零。在原假设h0成立的条件下,统计量F=(ESS/k)/{RSS/(n-k-1)}。服从自由度为(k,n-k-1)的F分布。给定显著性水平a可得到临界值Fa,由样本求出统计量F的数值,通过F>Fa或F<=Fa,来拒绝或接受原假设h0,以判定原方程总体上的线性关系是否显著成立。
变量的显著性检验(t检验):方程的总体线性关系显著,不等于每个解释变量对被解释变量的影响都是显著的,因此必须对每个解释变量进行显著性检验,以决定是否作为解释变量被保留在模型中,而这一检验是由对变量的t检验完成的。
t检验也同样设计原假设与备择假设h0和h1,给定显著性水平a,达到临界值,由样本求出统计量t的数值通过大小关系来拒绝或接受原假设h0,从而判定对应的解释变量是否应包括在模型中。
置信区间:参数的置信区间用来考察在一次抽样中所估计的参数距离参数的真实值有多近,在变量的显著性检验中已经知道,
容易推出,在(1-a)的置信水平下,b(贝塔)的置信区间是
,其中
为显著性水平,阿尔法自由度为n-k-1的临界值。
灰色预测GM(1,1)
神经网络
BP神经网络非线性函数拟合
GRNN(广义回归神经网络)
SVM回归预测分析
SVM的信息粒化时序回归预测
自组织竞争网络(模式分类、预测)
灰色神经网络预测