一、时间序列的生成
pd.date_range(start=None, end=None, periods=None, freq='D')
# start和end以及freq配合能够生成start和end范围内以频率freq的一组时间索引
# start和periods以及freq配合能够生成从start开始的频率为freq的periods个时间索引
# freq表频率缩写,一般是英文首字母大写
栗子:
二、时间字符串转化为时间序列
(常用于把读取文件中的时间字符串转化为时间序列)
# 我们可以使用pandas提供的方法把时间字符串转化为时间序列
df["timeStamp"] = pd.to_datetime(df["timeStamp"],format="")
# [“timeStamp”]就是时间字符串的那一列
# format参数大部分情况下可以不用写,但是对于pandas无法格式化的时间字符串,我们可以使用该参数,比如包含中文
三、pandas重采样
(对原始数据的时间频率进行更改)
四、PeriodIndex
(之前是时间戳,这个是时间段)
periods = pd.PeriodIndex(year=data["year"],month=data["month"],day=data["day"],hour=data["hour"],freq="H")
给这个时间段降采样:
data = df.set_index(periods).resample("10D").mean()