Pandas对时间序列数据提供了专门的支持,包括日期索引、时间频率转换、滚动窗口统计等功能。 可以使用pd.date_range()生成日期范围,并将其作为索引创建时间序列数据。还可以使用DataFrame.resample()、DataFrame.rolling()等方法进行时间序列数据的重采样和滚动窗口计算。
1.创建时间序列数据:
import pandas as pd
# 创建日期范围作为索引
index = pd.date_range('2023-01-01', '2023-12-31', freq='D')
# 创建具有随机值的时间序列数据
data = pd.DataFrame({'value': np.random.randn(len(index))}, index=index)
2.时间频率转换:
# 将时间序列数据按月重新采样,并计算每个月的平均值
monthly_data = data.resample('M').mean()
3.滚动窗口统计:
# 计算时间序列数据在滚动窗口内的移动平均值
rolling_mean = data['value'].rolling(window=7).mean()