数据处理中需要对数组按行或按列进行排序,或者对字典变量中的键值对排序。主要用到的两个函数为np.lexsort()和内置函数sorted()。如下说明处理过程。
- 对数组按最后一行排序,且保持列的相对位置不变
>>> import numpy as np
>>> data=np.array([[ 2, 7, 1, 2],[35, 9, 1, 2],[22, 4, 4, 2]])
>>> data
array([[ 2, 7, 1, 2],
[35, 9, 1, 2],
[22, 4, 4, 2]])
>>> idx=np.lexsort(data) #参数为二维数组时,按照最后一行升序,最后一行的值相同时按照倒数第二行升序
>>> idx
array([3, 2, 1, 0])
>>> data[:, idx]
array([[ 2, 1, 7, 2],
[ 2, 1, 9, 35],
[ 2, 4, 4, 22]])
- 对数组按第一列排序,且保持行的相对位置不变
>>> import numpy as np
>>> data=np.array([[ 2, 7, 1, 2],[35, 9, 1, 2],[22, 4, 4, 2]])
>>> data
array([[ 2, 7, 1, 2],
[35, 9, 1, 2],
[22, 4, 4, 2]])
>>> data_T=data[:,::-1].T #通过将列逆序,并求矩阵的转置,从而将第一列变为最后一行
>>> data_T
array([[ 2, 2, 2],
[ 1, 1, 4],
[ 7, 9, 4],
[ 2, 35, 22]])
>>> idx=np.lexsort(data_T)
>>> idx
array([0, 2, 1])
>>> data[idx]
array([[ 2, 7, 1, 2],
[22, 4, 4, 2],
[35, 9, 1, 2]])
- 按照字典变量的键或值进行排序
>>> data={3:5, 2:1, 5:4, 8:4, 4:9}
>>> data
{8: 4, 2: 1, 3: 5, 4: 9, 5: 4}
>>> data_key=sorted(data.items(), key=lambda e:e[0], reverse=False) #按字典的键进行升序
>>> data_key
[(2, 1), (3, 5), (4, 9), (5, 4), (8, 4)]
>>> data_key=sorted(data.items(), key=lambda e:e[0], reverse=True) #按字典的键进行降序
>>> data_key
[(8, 4), (5, 4), (4, 9), (3, 5), (2, 1)]
>>> data_val=sorted(data.items(), key=lambda e:e[1], reverse=False) #按字典的值进行升序
>>> data_val
[(2, 1), (8, 4), (5, 4), (3, 5), (4, 9)]
参看文献: