第一次做机器学习,选了个最简单的,并附上python代码
参考R语言版:https://www.cnblogs.com/ECJTUACM-873284962/p/7379717.html
——2018年12月
问题描述
裙摆长度和经济学的关系有个专门的名词叫做“裙摆指数”(Hemline Index),这个理论由经济学家乔治·泰勒(George W.Taylor)在1926年首次提出,他发现,女性的裙摆越长,股市就越低迷;相反,女性裙摆越短,股市就越容易出现高涨的趋势。
数据
- 数据来源:http://robjhyndman.com/tsdldata/roberts/skirts.dat
- 数据描述: Diameter of skirts at hem, 1866-1911, annual
- 数据特点:非季节性的时间序列
将数据如下图保存为csv文件
时间序列,就是按时间顺序排列的,随时间变化的数据序列。生活中各行各业有太多时间序列的数据了,销售额,顾客数,访问量,股价,油价,GDP,气温。。。
时间序列的平稳性:
- 随机过程的特征有均值、方差、协方差等。
- 如果随机过程的特征随着时间变化,则此过程是非平稳的;
- 相反,就称此过程是平稳的。下图左边非平稳,右边平稳
预测方法介绍——ARIMA模型
ARIMA(p,d,q)模型
- 其中 d 是差分的阶数,用来得到平稳序列。
- AR是自回归,p为相应的自回归项。
- MA为移动平均,