python时间序列分析

最新推荐文章于 2024-10-14 14:55:33 发布

大白砌墙

最新推荐文章于 2024-10-14 14:55:33 发布

阅读量1.7k

点赞数 52

文章标签： python 开发语言

本文链接：https://blog.csdn.net/java2508/article/details/135817643

版权

本文介绍了Python进行时间序列分析的基础知识，包括环境配置、时间序列模型ARIMA、pandas时间序列操作、平稳性检验以及如何处理非平稳序列。重点讨论了对数变换、移动平均和差分在平稳性处理中的应用。

摘要由CSDN通过智能技术生成

环境配置

python推荐直接装Anaconda，它集成了许多科学计算包，有一些包自己手动去装还是挺费劲的。statsmodels需要自己去安装，这里我推荐使用0.6的稳定版，0.7及其以上的版本能在github上找到，该版本在安装时会用C编译好，所以修改底层的一些代码将不会起作用。

时间序列分析

1.基本模型

自回归移动平均模型(ARMA(p，q))是时间序列中最为重要的模型之一，它主要由两部分组成： AR代表p阶自回归过程，MA代表q阶移动平均过程，其公式如下：
　　在这里插入图片描述在时间序列中，ARIMA模型是在ARMA模型的基础上多了差分的操作。

2.pandas时间序列操作

大熊猫真的很可爱，这里简单介绍一下它在时间序列上的可爱之处。和许多时间序列分析一样，本文同样使用航空乘客数据（AirPassengers.csv）作为样例。

数据读取：

# -*- coding:utf-8 -*-
import numpy as np
import pandas as pdfrom datetime import datetimeimport matplotlib.pylab as plt
# 读取数据，pd.read_csv默认生成DataFrame对象，需将其转换成Series对象df = pd.read_csv('AirPassengers.csv', encoding='utf-8', index_col='date')df.index = pd.to_datetime(df.index)  # 将字符串索引转换成时间索引ts = df['x']  # 生成pd.Series对象# 查看数据格式ts.head()ts.head().index

在这里插入图片描述
查看某日的值既可以使用字符串作为索引，又可以直接使用时间对象作为索引