【Python数据处理专题】-时间序列

本文详细介绍了Python中pandas库的时间序列处理,包括DatetimeIndex的基础操作、时间序列的重采样、截取、日期范围生成、日期偏移量以及时间维度的转换。此外,还探讨了datetime模块的使用,如不同日期时间类型的转换和处理,以及在数据处理中如何进行时间序列的聚类分组。
摘要由CSDN通过智能技术生成

时间序列

pandas时间序列

  • time series
    • 结构化数据形式
  1. 时间戳,timestamp,特定的时刻
  2. 固定时期,period
  3. 时间间隔,interval

时间序列基础

DatetimeIndex

  • pandas中的datetime对象

  • ts = pd.Series(np.random.randn(6),
                   index=pd.date_range('2018/11/11',period=6))
    
    ts.index # DatetimeIndex,时间戳
    ts.index.dtype # 用Numpy的datetime64数据类型以 纳秒 形式存储时间戳
    ts.index[0] # Timestamp
    

对Series的操作

  • 索引

    ts['2018/11/11']
    ts['20181111']
    ts['2018']
    ts['2018/11']
    
  • 切片

    ts[datetime(2018,11,11):]
    ts['2018/11/11':'2019/11/11'] # 用不存在与该时间序列中的时间戳切片
    
  • 过滤

    ts.truncate(after='2018/11/12')
    

对DataFrame的操作

  • 对DataFrame的操作

    df.loc['2018/11']
    
  • 对非唯一时间戳聚合

    df.index.is_unique # 属性判断索引是否唯一
    df.groupby(level=0).mean()
    

重采样

  • resampling

    • 将时间序列从一个频率转换到另一个频率的处理过程
      • 高频率 聚合 低频率——降采样(downsampling)
      • 升采样(upsampling):低频率数据 转换到 高频率
      • 并不是所有的重采样,都被划分为这两大类
        • W-WED(每周三)转换为W-FRI,既不是降采样也不是升采样
    ts.resample('D') #字符串‘D’是每天的意思
    ts.resample('M',kind='period').mean()
    

resample方法的参数

  • ts.resample(freq=, # 重采样频率的字符串
                axis=, # 重采样的轴,默认axis=0
                fill_method=, # 升采样如何插值:‘ffill’,‘bfil
  • 2
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值