Pandas使用groupby()时是否会保留顺序?

当使用Pandas的groupby()函数时,如果groupkey包含中文,可能会出现排序混乱的情况。这是因为默认情况下,groupby()会进行排序,但Pandas可能无法正确处理中文排序。为避免这种情况,可以在调用groupby()时设置`sort=False`参数,禁止排序。这样可以保持原始数据顺序不变。解决中文排序问题,可以考虑先对中文列进行自定义排序或转换为适合排序的编码。
摘要由CSDN通过智能技术生成

答案是否。

groupby()时,默认会以group key的顺序进行排序。

但pandas对中文无法进行排序,或者排序错乱。

此时我们不想在groupby()时排序,可以设置参数sort=False(该参数默认为True)。

举个例子:

比如我们的原始数据是id=['一组','二组','三组']

当我们以这个id进行groupby()时,出来的结果就不是按'一组','二组','三组'

不难发现,groupby之后的顺序,其实并不是我们想要的排序顺序。

那是因为我们以id作为分组,所以排序方式变成了id为主。

要解决这个问题,我查了一下官方文档。在官方文档的groupby里面有这么一个参数是可以传的

 

参考链接:

Dataframe GroupBy的顺序错误

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值