pandas dataframe 里的resample 到底干嘛用的

O‘Reilly 的《利用python进行数据分析》一书中是这样说的

【重新采样】是指将时间序列从一个频率转换为另一个频率的过程

【向下采样】将更高频率的数据聚合到低频率
【向上采样】将低频率转换到高频率

resample拥有类似于groupby 的API;调用resample对数据分组,之后再调用聚合函数。

----------示例------------

rng=pd.date_range('2000-01-01',periods=100,freq='D')
ts=pd.Series(np.random.randn(len(rng)),index=rng)
ts
2000-01-01   -0.174652
2000-01-02    1.015691
2000-01-03   -1.528498
2000-01-04    0.255951
2000-01-05    0.518026
                ...   
2000-04-05    0.151923
2000-04-06   -0.206902
2000-04-07   -1.162723
2000-04-08    0.587258
2000-04-09    0.061883
Freq: D, Length: 100, dtype: float64

ts.resample('M').mean()
2000-01-31   -0.024317
2000-02-29   -0.064409
2000-03-31   -0.049029
2000-04-30   -0.203543
Freq: M, dtype: float64

ts.resample('M',kind='period').mean()
2000-01   -0.024317
2000-02   -0.064409
2000-03   -0.049029
2000-04   -0.203543
Freq: M, dtype: float64In [ ]:
参数描述
freq表明所需采样频率的字符串或DateOffset对象,例如’M‘,’5min‘,Second(1)
axis默认为0
fill_method向上采样时的插值方式,ffill 或 bfill,默认不插值
closed向下采样中,每段间隔的时间的哪一段是封闭的,‘right’或‘left’
label
loffset
limit
kind对区间(‘period’)或时间戳(’timestamp’)的聚合;默认为时间序列索引的类型
convention

有空再更

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值