在数组的统计分析中,经常需要对数组进行排序、去重与重复、搜索和计数等操作。而这些操作是通过执行 NumPy 中的相关函数来实现的,下面先对数组的排序进行介绍。
NumPy 的排序方式主要分为直接排序和间接排序两种。直接排序是指对数值直接进行排序;间接排序是指根据一个或多个键对数据集进行排序。在 NumPy 中,直接排序常用 sort() 函数,而间接排序常用 argsort() 函数和 lexsort() 函数。
sort() 函数
sort() 函数用于返回输入数组的排序副本,函数格式如下:
numpy.sort(arr[,axis,kind,order])
函数中主要参数说明如下:
arr:输入数组;
axis:指定沿着某个轴排序数组,axis=0 表示按列排序,axis=1 表示按行排序。若没有设置 axis,则按行排序;
kind:指定排序算法是快速排序(Quicksort)、归并排序(Mergesort)或是堆排序(Heapsort),默认值为 Quicksort;
order:如果数组包含字段,则用于指明排序的字段。
sort() 函数除了 arr 参数外,其余参数都为可选项。
sort() 函数示例代码 example1 如下。
# -*- coding: utf-8 -*-
import numpy as np
arr = np.array([[4,5,3],[8,1,7]])
print('原数组',arr)
a =np.sort(arr) #调用 sort() 函数
print('sort()函数排序',a)
b = np.sort(arr,axis=0) #沿轴 0 排序
print('沿轴 0 排序',b)
c = np.sort(arr,axis=1) #沿轴 1 排序
print('沿轴 1 排序',c)
# 使用sort 函数设置排序字段
dt = np.dtype([('name',np.str,10),('age',int)])
arr = np.array([("李明",19),("王力",21),("张艳",18)],dtype = dt)
print ('自定义的数组是:',arr)
print('按 name 排序:')
print(np.sort(arr, order='name'))
argsort() 函数
argsort() 函数用于使输入数组沿着给定轴执行间接排序,并根据指定排序类型返回数据的索引数组。使用该索引数组可以获得排序数据。
argsort() 函数的格式和参数与 sort() 函数相同。其示例代码 example2 如下。
# -*- coding: utf-8 -*-
import numpy as np
arr = np.array([4,5,3,8,1,7])
print('原数组',arr)
a = np.argsort(arr) #数组排序后的索引数组
print('调用argsort() 函数:',a)
#根据索引数组重构排序数组
print ('用循环输出排序数组')
for i in a:
print(arr[a])
lexsort() 函数
lexsort() 函数使用键序列执行间接排序,键可以看作是电子表格中的一列,最后一个键是排序的主键,该函数返回一个索引数组。使用该索引数组可以获得排序数据。lexsort() 函数格式如下:
numpy.lexsort(keys[,axis])
函数中主要参数说明如下:
keys:键序列;
axis:指定沿着某个轴排序数组,为可选项。
其示例代码 example3 如下。
# -*- coding: utf-8 -*-
import numpy as np
k = ('name','age','tel')
v = ('李明', '21', '13871234456')
ind = np.lexsort((k,v))
print ('调用lexsort() 函数:',ind)
print ('使用这个索引来获取排序后的数据:')
print ([k[i] + ", " + v[i] for i in ind])