python如何设置两列索引_python - 如何有效地过滤由两列groupby操作获得的数据帧,以仅包含第二个索引的最大值和最小值? - SO中文参考 - www.soinside.com...

通过`groupby`操作得到的Python DataFrame如何筛选每组的最小值和最大值。讨论了使用循环的替代方法,以及如何更高效地利用Pandas操作实现这一目标。
摘要由CSDN通过智能技术生成

我有一个数据框df,它是通过执行两列groupby操作获得的:

df = data.groupby(['letters', 'syllables']).size()

这是df的前11行的输出:

0

letters syllables

1 1 25

3 1

2 1 188

2 44

3 1

4 1

3 1 1304

2 189

3 89

4 2

5 3

我想过滤df,以便对于letters中的每个索引,只显示syllables的最大和最小索引,给出以下输出:

0

letters syllables

1 1 25

3 1

2 1 188

4 1

3 1 1304

5 3

更好的方法是创建一个这样的数据框:

0

letters statistic syllables

1 min 1 25

max 3 1

2 min 1 188

max 4 1

3 min 1 1304

max 5 3

完整数据帧有120行。我知道我可以通过循环来做到这一点,但我想更好地理解pandas操作,并想知道如何更有效地做到这一点。

上面的示例数据可以使用以下命令从csv文件导入到多级索引数据框中:

df = pd.read_csv('data.csv', index_col

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值