pandas的时间序列
首先我们可以通过pd.date_range()来设置一个时间序列
pd.date_range(start=None, end=None, periods=None, freq=‘D’)
start和end以及freq配合能够生成start和end范围内以频率freq的一组时间索引,start和periods以及freq配合能够生成从start开始的频率为freq的periods个时间索
可以使用pandas提供的方法把时间字符串转化为时间序列
df[“timeStamp”] = pd.to_datetime(df[“timeStamp”],format="")
其中format是格式化,一般使用较少,format参数大部分情况下可以不用写,但是对于pandas无法格式化的时间字符串,我们可以使用该参数,比如包含中文。
重采样:指的是将时间序列从一个频率转化为另一个频率进行处理的过程,将高频率数据转化为低频率数据为降采样,低频率转化为高频率为升采样
pandas提供了一个resample的方法来帮助我们实现频率转化
DatetimeIndex可以理解为时间戳
PeriodIndex可以理解为时间段,一般可以吧时间字符串转化为时间索引
例:
peried_temp = pd.PeriodIndex(year=df[“year”], month=df[“month”], day=df[‘day’], hour=df[‘hour’], freq=‘H’)