pandas排序

简介

pandas排序函数。可以(1)按索引排序(2)按某些列排序(3)排位次,新生成一列位次列。

sort_index()按索引排序

语法: DataFrame.sort_index(axis=0, level=None, ascending=True, inplace=False, kind=‘quicksort’, na_position=‘last’, sort_remaining=True)
用途: 按照索引排序,如果是多级索引,level可以指定按那一级排序;axis指定排行索引还是列索引;na_position指定把空值放在最前边还是最后边。
参数说明:

  • axis: {0 or ‘index’, 1 or ‘columns’}, default 0
  • level: int or level name or list of ints or list of level names。可以是等级名称(列表),等级位置(列表)
  • ascending: bool, default True。升序或降序
  • inplace: bool, default False。是否原地操作数据对象
  • kind: {‘quicksort’, ‘mergesort’, ‘heapsort’}, default ‘quicksort’。排序方法
  • na_position: {‘first’, ‘last’}, default ‘last’。把空置放在前边还是后边
  • sort_remaining: bool, default True。如果是多级索引,只指定了其中某几级进行排序,可以指定剩余的几级索引是否也排序。

sort_values()按列排序

语法: DataFrame.sort_values(by, axis=0, ascending=True, inplace=False, kind=‘quicksort’, na_position=‘last’)
用途: 按照某列或某几列排序。
参数说明:

  • by: str or list of str。排序列
  • axis: {0 or ‘index’, 1 or ‘columns’}, default 0。纵向排序or横向排序
  • inplace: bool, default False
  • kind: {‘quicksort’, ‘mergesort’, ‘heapsort’}, default ‘quicksort’。排序算法
  • na_position: {‘first’, ‘last’}, default ‘last’。把NaN放在前边还是后边

rank()排位次

语法: DataFrame.rank(self, axis=0, method=‘average’, numeric_only=None, na_option=‘keep’, ascending=True, pct=False)
用途: 对一列元素进行排序,并生成一列位次列。method可以指定遇到相同元素的排序方式;
参数说明:

  • axis: {0 or ‘index’, 1 or ‘columns’}, default 0
  • method: {‘average’, ‘min’, ‘max’, ‘first’, ‘dense’}, default ‘average’。遇到相同元素如何排序
    • average:都取取位次的均值,1、4、4、5位次为1、2.5、2.5、3
    • min:都取最小位次,1、4、4、5位次为1、2、2、4
    • max:都取最大位次,1、4、4、5位次为1、3、3、4
    • first:按照元素在数组中出现的顺序取位次
    • dense:紧密排序,1、4、4、5位次为1、2、2、3
  • numeric_only: bool, optional。是否只对数值列排序
  • na_option: {‘keep’, ‘top’, ‘bottom’}, default ‘keep’。如何处理空值
    • keep:不参与排序,位次列保持NaN
    • top:当成相同元素排在前面
    • bottom:当成相同元素排在后面
  • ascending: bool, default True。正序或倒序
  • pct: bool, default False。是否以百分比的形式展示位次列
df = pd.DataFrame(data={'Animal':['cat', 'penguin', 'dog', 'spider', 'snake'],
                        'Number_legs': [4, 2, 4, 8, np.nan]})
df['dense_rank'] = df['Number_legs'].rank(method='dense')
df['first_rank'] = df['Number_legs'].rank(method='first')
df['min_rank'] = df['Number_legs'].rank(method='min')
df['max_rank'] = df['Number_legs'].rank(method='max')
df['average_rank'] = df['Number_legs'].rank(method='average')
df['first_rank_pct'] = df['Number_legs'].rank(method='first', pct=True)

out

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值