我有一个函数,它根据条件将numpy数组转换为包含True或False的数组,然后将相邻的True或False条目分组,并计算每组的长度。这是为了确定一个月降水数据中旱季或雨季的长度。在
这是函数:import itertools
def spell(X, kind='wet', how='mean', threshold=0.5):
if kind=='wet':
condition = X>threshold
else:
condition = X<=threshold
length = [sum(1 if x==True else nan for x in group) for key,group in itertools.groupby(condition) if key]
if not length:
res = 0
elif how=='mean':
res = np.mean(length)
else:
res = np.max(length)
return res
因此,基本上有一个选项来确定平均长度或最大长度的湿或干期给定一个numpy数组降水数据,默认参数设置为平均湿期长度。在
我将此函数用于pandas,将其应用于历史记录的每个月:
^{pr2}$
我得到的是:0
1960-01-31 1.555556
1960-02-29 1.500000
1960-03-31 1.777778
1960-04-30 6.000000
这是完美的,但是我希望能够改变这个函数的默认值,这样我就可以使用它的其他选项了数据框重采样(). 我已经研究过functools.partial(),但是这只是对输入参数显式设置的情况的解决方案,即spell(kind='dry', how='max', threshold=0.7)。有没有一种方法可以更改函数的默认参数,而不需要在后面显式地设置它们,这样我就可以在df.resample()中使用它了?在