python resample() 函数(用于数据聚合)

以下是利用Python进行数据分析中低十章对resample方法具体解释,不过how参数已经过时

 


#把流量数据每3分钟聚合一次
def flowdata_fusion_3(temp_volume_series, temp_time_series):
    # print(temp_volume_series)
    temp_volume_series.index = temp_time_series
    ts = pd.Series(temp_volume_series)
    flowdata_fusion_3min = ts.resample('3min', label='left', closed='left').sum()
    # print(date_fusion_3min)
    return flowdata_fusion_3min

 temp_volume_series代表这检测器获取的数流量,是Series格式,它的默认索引是0~~xx,想把它的索引改为流量对应的时间格式

之前用的是pd.Series(temp_volume_series).reindex(temp_time_series)

或者pd.Series(temp_volume_series,index=temp_time_series),但是结果聚合后,流量值全都变为NAN。这两种方式只是重排,说白了就是重新创建了新的的索引,但是流量数据还在默认的索引中,所以新的流量不存在就用NAN代替。

解决方法:

直接获取它全部的索引值强制改变 temp_volume_series.index = temp_time_series

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值