1. 时间序列分析概述
时间序列分析在金融、气象、交通、宏观经济等诸多领域的应用可以说是非常的广泛。简单点说,时间序列就是在各个时间点上形成的数值序列,而分析的过程就是通过这些数值序列去研究其自身的变化规律。
时间序列通常使用 pandas 中的 series 结构(一个时间点对应一个数值数据)或者 dataframe 结构(一个时间点对应多个数值数据)来表示,和 series 和 dataframe 结构本质上是一样的,唯一一个重要的不同就是,他的索引数据是时间类型的。
时间类型的数据作为一种特殊的数据形式,和一般的数值类型或者字符串类型相比,要多了不少的讲究。因此首先我们专门来介绍如何在 python 中对日期和时间的进行表示,这也是后续时间序列分析的基础。
我们先从 python 标准库与第三方库入手,介绍其中的日期、时间、时间增量和时间跨度的表示工具。当然了,说实话其实 pandas 中提供的时间序列工具更适合用来进行相关问题的处理,但是我想从标准库入手,可以帮助我们去搞清楚整个问题的来龙去脉,对我们更好的理解问题和使用工具将大有裨益。
2. 原生工具:datetime 和 dateutil
首先,我们第一个要介绍的就是 python 中的原生工具:datetime 与 dateutil。
datetime 是 python 中的标准库,最基本的日期和时间功能都包含在其中了。而 dateutil 是一个强大的第三方库,如果将二者搭配进行使用,可以收到奇效,方便快捷的解决诸多问题。
2.1 日期的创建
首先我们来利用 datetime 类型来创建一个日期。
代码片段:
from datetime import datetime