本人今天遇到遇到一个任务,计算同月份合约当天各合约总持仓量的移动平均值。立刻写下了这个函数:
group = df.groupby(['合约系列','date'])
f = pd.DataFrame(group['持仓量'].sum().rolling(20).mean())
上交后,提出要求,不行,这个数据不行,存在一些数据,因为不足20天,导致结果为NAN。一开始没想到思路,然后就问问群里的大佬,大佬给的第一个建议,写个功能函数。但是因为数据比较复杂,非连续数据,光是分类就很难,就继续询问。
知道一位大佬给了个答案:
group = df.groupby(['合约系列','date'])
f = pd.DataFrame(group['持仓量'].sum().rolling(20,min_periods = 1).mean())
min_periods:#表示窗口最少包含的观测值为1
意味着数据不满20天的,自动有一天算一天,计算均值。如第19天数据,此时显示的结果就是前面19天的均值。