不管在哪个领域中(如金融学、经济学、生态学、神经科学、物理学等),时间序列(time series)数据都是一种重要的结构化数据形式。在多个时间点观察或测量到的任何事物都可以形成一段时间序列。很多时间序列都是固定频率的,也就是说,数据点是根据某种规律定期出现的(比如每15秒、每5分钟、每个月出现一次)。时间序列也可以是不定期的。时间序列数据的意义取决于具体的应用场景,主要有以下几种:
- 时间戳(timestamp),特定的时刻。
- 固定时期(period),如2018年4月或2017全年。可以看做时间间隔的特例。
- 时间间隔,由起始和结束时间戳表示。
- 实验或过程时间,每个时间点都是相对于特定起始时间的一个度量。
日期和时间数据类型及工具
python标准库包含用于日期(date)和时间(time)数据的数据类型,而且还有日历方面的功能。主要用到的模块:datetime、time以及calendar模块。
代码示例:
from datetime import datetime
from datetime import timedelta
#毫秒形式存储日期和时间
#datetime(year, month, day, hour, minute, second, microsecond)
now = datetime.now() #now=datetime.datetime(2018, 4, 10, 16, 56, 29, 739397)
#datetime.timedelta表示两个datetime对象之间的时间差
#timedelta(days,seconds)
delta = datetime(2018, 4, 10) - datetime(2017, 7, 1, 1, 20)
#delta= datetime.timedelta(282, 81600)
#给datetime对象加/减上timedelta
start = datetime(2018, 1, 1)
start + timedelta(12) #result:datetime.datetime(2018, 1, 13, 0, 0)
start - 2 * timedelta(12) #result:datetime.datetime(2017, 12, 8, 0, 0)
字符串与data