前言
在实际应用过程中,会出现不少时间序列相关数据,为了让不同频率数据统一时间标准,需要将数据按小时、分钟等方式进行分组,然后取组的平均值或中位数最为组的值,如果自己写算法会比较麻烦且耗时,pandas提供了一个函数可以快速解决此类问题:DataFrame.resample()。
提示:为方便快捷地解决问题,本文仅介绍函数的主要用法,并非全面介绍
一、DataFrame.resample()是什么?
DataFrame.resample()函数是频率转换和时间序列重采样的便捷方法。对象必须具有datetime类似的索引。
二、DataFrame.resample()函数参数及说明
DataFrame.resample(rule,axis=0,closed=None,label=None,convention=‘start’,kind=None,loffset=None,base=None,on=None,level=None,origin=‘start_day’,offset=None)
主要参数说明
rule:DateOffset、Timedelta或str。表示目标转换的偏移量字符串或对象。
axis:{0 or ‘index’, 1 or ‘columns’}, 默认0。用于上采样或下采样的轴。对于Series,它将默认为0,即沿着行计算。必须为 DatetimeIndex,TimedeltaIndex或PeriodIndex。
c