时序数据有四种主要的组成方式
1.trend 趋势: 可以是线性的也可以是非线性的,但可以研究其参数
2. seasonality 季度变化:可以是加法型的,也可以是乘法型的
3. noise 噪音:噪音一般都是数据中的一段,所以找到方法来减小噪音是分析过程的关键
4. 其他:例如意外值,缺失值等等
有这四种成分,我们可以得到分析时间序列的方法
描述:用这四种成分来描述一段数据
预测:预测未来的数据
控制:为了得到某个制定的数据,监控一个数据过程
对于实际数据采集的要求
1. 数据点需要等时间间隔的采集: 如果采集的点有缺失,或者不是等时间间隔的,则需要改正数据,重新采集
2. 数据点要超过50:可能一些经济学上的数据大致在12 个这样,但一个系列的数不能只有3,4个
3.这一系列的数据平稳,没有趋势,季度变化和噪音:有些实际的数据可能要去除趋势和季度变化
平滑Smooth
平滑用于去噪声
去噪的方法有很多,在实验数据采集里可以选择很多的点,来减少噪声,但在很多经济现象中数据量是一定的,所以需要平滑数据
1. 窗口取平均: Xi点的平滑后的Si Si=( Xi-k+...+Xi+k)/2K+1
2. si=(wi-k *Xi-k+....wi+k*Xi+k) 其中的wi-k+...wi+k=1
3.