对数据进行排序,是非常高频使用的功能,Python 对排序支持是做的非常好的,主要涉及两个函数&两种数据类型,组合起来四种情况。
对Series排序
-
Series.sort_index:Series索引排序
-
Series.sort_values Series值排序
对DataFrame排序
-
DataFrame.sort_index: DataFrame索引排序
-
DataFrame.sort_values:DataFrame值排序
一、对Series的排序
1、索引排序函数sort_index
定义一个Series用于测试
s = Series([4,1,2,3],index=['d','a','c','b'])
d 4
a 1
c 2
b 3
对Series的索引进行升序排序,使用默认参数就行,无需设置其他参数
s.sort_index()
a 1
b 3
c 2
d 4
对Series的索引进行降序排序,需要设置ascending=False参数
s.sort_index(ascending=False)
d 4
c 2
b 3
a 1
2、值排序函数sort_values
用 法:
Series.sort_values(ascending=True, inplace=Flase)
参数:
-
ascending:默认为True升序排列,为Flase降序排序
-
inplace:是否修改原始的Series
对Series的值进行升序排序,默认即可,无需使用其他参数
s = Series([4,1,2,3],index=['d','a','c','b'])
s.sort_values()
a 1
c 2
b 3
d 4
对Series的值进行降序排序,使用ascending=False参数
s.sort_values(ascending=False)
d 4
b 3
c 2
a 1
二、 对DataFrame的排序
1、索引排序函数sort_index
基础用法
DataFrame.sort_index(
by=None,
axis=0, level=None,
ascending=True,
inplace=False,
kind='quicksort',
na_position='last',
sort_remaining=True
)
参数含义:
-
by:str or list of str;如果axis=0,那么by=“列名”;如果axis=1,那么by=“行名”。
-
axis:0按照行名排序;1按照列名排序
-
level:默认None,否则按照给定的level顺序排列—貌似并不是,文档
-
ascending:布尔型,True则升序,如果by=[‘列名1’,‘列名2’],则该参数可以是[True, False],即第一字段升序,第二个降序。
-
inplace:默认False,布尔型,是否用排序后的数据框替换现有的数据框。
-
kind:排序方法,{‘quicksort’, ‘mergesort’, ‘heapsort’}, default ‘quicksort’。不用太关心
-
na_position:缺{‘first’, ‘last’}, default ‘last’,默认缺失值排在最后面。
构建数据集
import numpy as np
import pandas as pd
data = pd.DataFrame( np.arange(9).reshape(3,3),
index = ["0","2","1"],
columns = ["col_a","col_c","col_b"])
data
col_a col_c col_b
0 0 1 2
2 3 4 5
1 6 7 8
按行的索引****升序进行排序,默认按行,升序
data.sort_index()
col_a col_c col_b
0 0 1 2
1 6 7 8
2 3 4 5
按行的索引按降序进行排序
data.sort_index(ascending=False)
col_a col_c col_b
2 3 4 5
1 6 7 8
0 0 1 2
按列升序的索引进行排序
data.sort_index(axis=1)
Out[10]:
col_a col_c col_b
0 0 1 2
1 6 7 8
2 3 4 5
2、值排序函数sort_values
基本用法
DataFrame.sort_values(
by,
axis=0,
ascending=True,
inplace=False,
kind='quicksort',
na_position='last'
)
参数解释:
-
by:str or list of str;如果axis=0,那么by=“列名”;如果axis=1,那么by=“行名”。
-
axis:0按照行名排序;1按照列名排序
-
ascending:布尔型,True则升序,如果by=[‘列名1’,‘列名2’],则该参数可以是[True, False],即第一字段升序,第二个降序。
-
inplace:默认False,布尔型,是否用排序后的数据框替换现有的数据框。
-
kind:排序方法,{‘quicksort’, ‘mergesort’, ‘heapsort’}, default ‘quicksort’。不用太关心
-
na_position:缺{‘first’, ‘last’}, default ‘last’,默认缺失值排在最后面。
构建测试数据
data =pd.DataFrame([[2,3,12],[6,2,8],[9,5,7]],
index=["0", "2", "1"],
columns=["col_a", "col_c", "col_b"])
col_a col_c col_b
0 2 3 12
2 6 2 8
1 9 5 7
按指定列的值大小顺序进行排序
data.sort_values(by='col_c')
col_a col_c col_b
2 6 2 8
0 2 3 12
1 9 5 7
按多列进行排序
data.sort_values(by=['col_b','col_a'])
col_a col_c col_b
1 9 5 7
2 6 2 8
0 2 3 12
先按col_b列降序,再按col_a列升序排序
data.sort_values(by=['col_b','col_a'],axis=0,
ascending=[False,True]) col_a col_c col_b0 2 3 122 6 2 81 9 5 7
按行升序排列
data.sort_values(by='2',axis=1)
col_c col_a col_b
0 3 2 12
2 2 6 8
1 5 9 7
按 2行 升序,0行降排列
data.sort_values(by=['2','0'],axis=1)
col_c col_a col_b
0 3 2 12
2 2 6 8
1 5 9 7
推荐文章
技术交流
完整代码、数据获取,可以找我来要
目前开通了技术交流群,群友已超过3000人,添加时最好的备注方式为:来源+兴趣方向,方便找到志同道合的朋友
- 方式①、发送如下图片至微信,长按识别,后台回复:加群;
- 方式②、添加微信号:dkl88191,备注:来自CSDN
- 方式③、微信搜索公众号:Python学习与数据挖掘,后台回复:加群
技术交流、求职内推、干货汇总、与 3000+来自阿里、北大、清华、中科院、CMU、腾讯、百度等名校名企开发者互动交流~