pandas DataFrame的.groupby().rank()

pandas DataFrame的.groupby().rank()

这个操作 是 对DataFrame某列的数据进行聚类 然后对其它列的属于同类数据进行数值大小排序

但是有几个参数的含义不是很理解

list1 = [1, 3, 1,0,7,4,0]
list2 = [3, 3, 2,0,4,4,5]
list3 = [3, 3, 3,3,4,4,6]
df1 = pd.DataFrame({'col1':list1,'col2':list2,'col3':list3})
print(df1)
df1=df1.set_index('col2')
df1 = df1.groupby(['col3']).rank(method='min',ascending=False)
print(df1)
df1=df1.reset_index()
print(df1)

运行结果如下,显然ascending代表是否升序,method='min'代表排序相同取小值,索引不会受影响

且对于多列数据会同时排序,验证如下

list1 = [1, 3, 1,0,7,4,0]
list2 = [3, 3, 2,0,4,4,5]
list3 = [3, 3, 3,3,4,4,6]
df1 = pd.DataFrame({'col1':list1,'col2':list2,'col3':list3})
print(df1)
#df1=df1.set_index('col2')
df1 = df1.groupby(['col3']).rank(method='max',ascending=False)
print(df1)

  • 5
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值