我想切片(或筛选)属于d2.groupby(‘g’)中的组的那些组(尽管我为行定居.),其中组中s的最大值,对于行测试是1,是2.
pd.__version__
# '0.24.1'
d2 = pd.DataFrame({'g': [1, 1, 1, 2, 2, 2],
'test': [1, 1, 0, 1, 0, 0],
's': [1, 2, 3, 1, 2, 3]})
d2
g test s
0 1 1 1
1 1 1 2
2 1 0 3
3 2 1 1
4 2 0 2
5 2 0 3
用简单的英语来说:我想保留具有对应测试值1的s的最大值为2的组.对于下面的示例,我想保留g组1,因为第二行的test == 1和s == 2,并且第三行的s ==0.此数据的预期输出:
g test s
0 1 1 1
1 1 1 2
2 1 0 3
我已经尝试过d2.groupby(‘g’).filter(lambda x:(x.test == 1))#跟着废话以及d2.groupby(‘g’)[[d2.s == 1]]#更多废话.后者向我传达了有关Series对象可变和不可散列的信息.我尝试了许多其他同样无意义和无用的方法.在test为1的情况下,如何分组(‘g’)并按s的最大值进行过滤?这似乎应该很容易,但我无法理解.我可以通过添加一列来到达那儿,但这似乎有点麻烦.
注意:我已经找到了答案.我很乐意接受有关如何找到该问题的当前解决方案的任何搜索提示(如果有的话).谢谢!