【Python】一文搞懂Pandas数据排序

数据排序,是使用非常高频的功能,Pandas排序支持做的非常好,主要涉及两个函数,两种数据类型,组合起来四种情况。

Series排序

  • Series.sort_index 索引排序

  • Series.sort_values 值引排序

DataFrame排序

  • DataFrame.sort_index  索引排序

  • DataFrame.sort_values 值引排序

 

一、Series的排序

1、sort_index 索引排序

定义一个Series用于实验

s = Series([4,1,2,3],index=['d','a','c','b'])
d    4
a    1
c    2
b    3

 

对Series的索引进行升序排序,默认即可,无需使用其他参数

s.sort_index()
a    1
b    3
c    2
d    4

 

对Series的索引进行降序排序,使用ascending=False参数

s.sort_index(ascending=False)
d    4
c    2
b    3
a    1

 

2、sort_values 值引排序

用 法:

Series.sort_values(ascending=True, inplace=Flase)

参数:

  • ascending:默认为True升序排列,为Flase降序排序

  • inplace:是否修改原始的Series

 

对Series的值进行升序排序,默认即可,无需使用其他参数

s.sort_values()
a    1
c    2
b    3
d    4

 

对Series的进行降序排序,使用ascending=False参数

s.sort_values(ascending=False)
d    4
b    3
c    2
a    1

 

 

 

二、 DataFrame的排序

 

1、sort_index 索引排序

DataFrame.sort_index(by=None,
axis=0, level=None, 
ascending=True, 
inplace=False, 
kind='quicksort', 
na_position='last', 
sort_remaining=True)
  • by:按照某一列或几列数据进行排序,但是by参数貌似不建议使用

  • axis:0按照行名排序;1按照列名排序

  • level:默认None,否则按照给定的level顺序排列---貌似并不是,文档

  • ascending:默认True升序排列;False降序排列

  • inplace:默认False,否则排序之后的数据直接替换原来的数据框

  • kind:排序方法,{‘quicksort’, ‘mergesort’, ‘heapsort’}, default ‘quicksort’。似乎不用太关心。

  • na_position:缺失值默认排在最后{"first","last"}

 

构建数据集

import numpy  as np
import pandas as pd
data = pd.DataFrame( np.arange(9).reshape(3,3),
                 index   = ["0","2","1"],
                 columns = ["col_a","col_c","col_b"])
data
   col_a  col_c  col_b
0      0      1      2
2      3      4      5
1      6      7      8

 

按行的索引升序进行排序,默认按行,升序

data.sort_index()
   col_a  col_c  col_b
0      0      1      2
1      6      7      8
2      3      4      5

 

按行的索引降序进行排序

data.sort_index(ascending=False)
   col_a  col_c  col_b
2      3      4      5
1      6      7      8
0      0      1      2

 

按列升序的索引进行排序

data.sort_index(axis=1)
Out[10]: 
   col_a  col_c  col_b
0      0      1      2
1      6      7      8
2      3      4      5

 

 

2、sort_values 值引排序

 

用 法:

DataFrame.sort_values(
by, 
axis=0, 
ascending=True, 
inplace=False,
kind='quicksort', 
na_position='last')

参 数:

  • by:字符串或者List<字符串>;如果axis=0,那么by="列名";如果axis=1,那么by="行名"。

  • axis:{0 or ‘index’, 1 or ‘columns’}, default 0,默认按照列排序,即纵向排序;如果为1,则是横向排序。

  • ascending:布尔型,True则升序,如果by=['列名1','列名2'],则该参数可以是[True, False],即第一字段升序,第二个降序。

  • inplace布尔型,是否用排序后的数据框替换现有的数据框。

  • kind:排序方法,{‘quicksort’, ‘mergesort’, ‘heapsort’}, default ‘quicksort’。似乎不用太关心。

  • na_position:{‘first’, ‘last’}, default ‘last’,默认缺失值排在最后面。

 

构建实验用数据

data =pd.DataFrame([[2,3,12],[6,2,8],[9,5,7]], 
                 index=["0", "2", "1"], 
                 columns=["col_a", "col_c", "col_b"])
   col_a  col_c  col_b
0      2      3     12
2      6      2      8
1      9      5      7

 

按指定列的值大小顺序进行排序

data.sort_values(by='col_c')
   col_a  col_c  col_b
2      6      2      8
0      2      3     12
1      9      5      7

 

按多列进行排序

data.sort_values(by=['col_b','col_a'])
   col_a  col_c  col_b
1      9      5      7
2      6      2      8
0      2      3     12

 

先按col_b列降序,再按col_a列升序排序

data.sort_values(by=['col_b','col_a'],axis=0,ascending=[False,True]) 
   col_a  col_c  col_b
0      2      3     12
2      6      2      8
1      9      5      7

升序排列

data.sort_values(by='2',axis=1) 
    col_c  col_a  col_b
0      3      2     12
2      2      6      8
1      5      9      7

 

2行 升序,0行降排列

data.sort_values(by=['2','0'],axis=1) 
   col_c  col_a  col_b
0      3      2     12
2      2      6      8
1      5      9      7

 


往期精彩回顾



适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等资料打印机器学习在线手册深度学习笔记专辑《统计学习方法》的代码复现专辑
AI基础下载机器学习的数学基础专辑黄海广老师《机器学习课程》课件合集
本站qq群851320808,加入微信群请扫码:

  • 5
    点赞
  • 32
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值