假设我有以下数据框df:
date symbol_a symbol_b ratio
0 2017/01/01 AAAA AA 10
1 2017/01/02 AAAA AA 20
2 2017/01/03 AAAA AA 30
3 2017/01/04 AAAA AA 10
4 2017/01/05 AAAA AA 10
5 2017/01/06 AAAA AA 10
6 2017/01/01 BBBB BB 10
7 2017/01/02 BBBB BB 20
8 2017/01/03 BBBB BB 30
9 2017/01/04 BBBB BB 10
10 2017/01/01 CCCC CC 10
11 2017/01/02 CCCC CC 20
12 2017/01/03 CCCC CC 30
13 2017/01/04 CCCC CC 10
14 2017/01/05 CCCC CC 10
15 2017/01/06 CCCC CC 5
我对比率列的平均值感兴趣(这来自之前的数据框,其中有两个附加列value_a value_b和ratio = value_a / value_b,或多或少).我想做的是以下内容:
每n个元素用symbol_a(或_b实际上是相同的)取平均值.假设n = 3.
通常我会这样做:
df.groupby(['symbol_a','symbol_b']).mean()
但是,我希望每3天获得一次子装置(实际时间跨度显然要长得多,而且每5天需要一次).
最初我以为我总是会有相同数量的符号,可以被n整除,所以我尝试了类似的东西:
df.g