若干年不写博客,笔者近日决心潜心研究时间序列。拟从现有资料的整合、时序数据规律、统计学模型、机器学习模型、深度学习模型、与铁路及其他业务结合的模型进行。
入门还是以金融数据为主,可能偏向分解和预测。
入门教程:工作台 - Heywhale.com
数据集参考:DJIA 30 Stock Time Series | Kaggle
入门教程-2:时间序列分析(1) 基本概念与实战 - 知乎
分析流程:将时序数据分解为趋势、季节变化、噪声,进行观察;采用ARIMA、ARMA进行预测
(1)分解:
函数可用:
import statsmodels.api as sm
decomposed_google_volume = sm.tsa.seasonal_decompose(google["High"],period=360)
时间序列分解的成功与否,取决于两个因素:一是数据序列本身是隐藏着规律的,不可预测的部分只是其中的一小部分;二是分解的方法要合适,尤其是周期的判断要准确。