pandas numpy 时间序列

Bachelor??

于 2023-03-20 18:43:26 发布

阅读量92

点赞数

文章标签： pandas python 数据分析 Powered by 金山文档

本文链接：https://blog.csdn.net/hmdzjp/article/details/129673511

版权

#时间序列
import pandas as pd
import numpy as np
# index=pd.date_range('02/02/2020',periods=9,freq='T')
# series=pd.Series(range(9),index=index)
# print(series)
# print(series.resample('3T').sum())                #一分钟转换成三分钟       resample()

#降采样处理    高频率转变成低频率      聚合
# df=pd.read_excel('time.xls')
# df1=df.set_index('订单付款时间')
# print(df1.resample('W').sum())                       #一天变七天

#升采样处理    低频率转变成高频率   涉及数据填充
# rng=pd.date_range('20200202',periods=2)
# s1=pd.Series(np.arange(1,3),index=rng)
# print(s1,'\n')
# s1_6h_asfreq=s1.resample('6h').asfreq()                    #asfreq()  ???
# print(s1_6h_asfreq,'\n')
# s1_6h_pad=s1.resample('6H').pad()                         #pad()   ???
# print(s1_6h_pad,'\n')
# s1_6h_ffill=s1.resample('6H').ffill()
# print(s1_6h_ffill,'\n')
# s1_6h_bfill=s1.resample('6h').bfill()
# print(s1_6h_bfill)

#时间序列汇总   ohlc()
# rng=pd.date_range('2/2/2020',periods=12,freq='t')            #freq频率        T表分钟    D表天数
# s1=pd.Series(np.arange(12),index=rng)
# print(s1.resample('5t').ohlc())                   #找出四个值

#移动窗口数据计算    rolling()
index=pd.date_range('20200201','20200215')
data=[3,6,7,4,2,1,3,8,9,10,12,15,13,22,14]
s1=pd.Series(data,index)
print(s1,'\n')
print(s1.rolling(3).sum(),'\n')                 #画窗口，三个一组，当前值加前两值           mean，sum
print(s1.rolling(3,min_periods=1).mean())                   #指定最少包含的观测值，窗口只有一个值时用本身