#时间序列
import pandas as pd
import numpy as np
# index=pd.date_range('02/02/2020',periods=9,freq='T')
# series=pd.Series(range(9),index=index)
# print(series)
# print(series.resample('3T').sum()) #一分钟转换成三分钟 resample()
#降采样处理 高频率转变成低频率 聚合
# df=pd.read_excel('time.xls')
# df1=df.set_index('订单付款时间')
# print(df1.resample('W').sum()) #一天变七天
#升采样处理 低频率转变成高频率 涉及数据填充
# rng=pd.date_range('20200202',periods=2)
# s1=pd.Series(np.arange(1,3),index=rng)
# print(s1,'\n')
# s1_6h_asfreq=s1.resample('6h').asfreq() #asfreq() ???
# print(s1_6h_asfreq,'\n')
# s1_6h_pad=s1.resample('6H').pad() #pad() ???
# print(s1_6h_pad,'\n')
# s1_6h_ffill=s1.resample('6H').ffill()
# print(s1_6h_ffill,'\n')
# s1_6h_bfill=s1.resample('6h').bfill()
# print(s1_6h_bfill)
#时间序列汇总 ohlc()
# rng=pd.date_range('2/2/2020',periods=12,freq='t') #freq频率 T表分钟 D表天数
# s1=pd.Series(np.arange(12),index=rng)
# print(s1.resample('5t').ohlc()) #找出四个值
#移动窗口数据计算 rolling()
index=pd.date_range('20200201','20200215')
data=[3,6,7,4,2,1,3,8,9,10,12,15,13,22,14]
s1=pd.Series(data,index)
print(s1,'\n')
print(s1.rolling(3).sum(),'\n') #画窗口,三个一组,当前值加前两值 mean,sum
print(s1.rolling(3,min_periods=1).mean()) #指定最少包含的观测值,窗口只有一个值时用本身
12-21
06-28