由于您按年龄分组,让我们这样做并返回每个组的所有排列,然后获取产品(使用itertools的产品和排列函数):
In [11]: age = df.groupby("age")
如果我们看一个组的排列:
In [12]: age.get_group(21)
Out[12]:
age name
2 21 Chris
4 21 Evan
In [13]: list(permutations(age.get_group(21).index))
Out[13]: [(2, 4), (4, 2)]
In [14]: [df.loc[list(p)] for p in permutations(age.get_group(21).index)]
Out[14]:
[ age name
2 21 Chris
4 21 Evan, age name
4 21 Evan
2 21 Chris]
我们可以通过返回每个组的索引来对整个DataFrame执行此操作(假设索引是唯一的,如果在执行此操作之前它不是reset_index …您可能能够执行稍微更低级别的操作):
In [21]: [list(permutations(grp.index)) for (name, grp) in age]
Out[21]: [[(1,)], [(2, 4), (4, 2)], [(3,)], [(0,)]]
In [22]: list(product(*[(permutations(grp.index)) for (name, grp) in age]))
Out[22]: [((1,), (2, 4), (3,), (0,)), ((1,), (4, 2), (3,), (0,))]