我需要同时对两个数组进行排序,或者我需要对其中一个数组进行排序,并在进行排序时将其关联数组的相应元素也带进去。 那就是如果数组是[(5,33),(4,44),(3,55)]并且我按第一个轴排序(标记为dtype ='alpha'下面),那么我想要:[(3.0,55.0 )(4.0,44.0)(5.0,33.0)]。 这些都是非常大的数据集,在执行其他一些操作之前,我需要先排序(对于nlog(n)speed)。 我不知道如何以适当的方式合并两个单独的数组以使排序算法正常工作。 我认为我的问题很简单。 我尝试了三种不同的方法:
import numpy
x=numpy.asarray([5,4,3])
y=numpy.asarray([33,44,55])
dtype=[('alpha',float), ('beta',float)]
values=numpy.array([(x),(y)])
values=numpy.rollaxis(values,1)
#values = numpy.array(values, dtype=dtype)
#a=numpy.array(values,dtype=dtype)
#q=numpy.sort(a,order='alpha')
print "Try 1:\n", values
values=numpy.empty((len(x),2))
for n in range (len(x)):
values[n][0]=y[n]
values[n][1]=x[n]
print "Try 2:\n", values
#values = numpy.array(values, dtype=dtype)
#a=numpy.array(values,dtype=dtype)
#q=numpy.sort(a,order='alpha')
###
values = [(x[0], y[0]), (x[1],y[1]) , (x[2],y[2])]
print "Try 3:\n", values
values = numpy.array(values, dtype=dtype)
a=numpy.array(values,dtype=dtype)
q=numpy.sort(a,order='alpha')
print "Result:\n",q
我注释了第一次和第二次尝试,因为它们会产生错误,我知道第三次尝试会起作用,因为这与我在RTFM时所看到的情况相似。 给定数组x和y(它们非常大,仅显示示例),如何构造numpy.sort可以正确调用的数组(称为值)?
*** Zip效果很好,谢谢。 额外的问题:以后如何将已排序的数据再次解压缩为两个数组?
#1楼
西蒙建议使用argsort作为替代方法。 我建议将其作为一种方法。 不会出现混乱的合并,压缩或解压缩:只需按索引访问即可。
idx = numpy.argsort(x)
ans = [ (x[idx[i]],y[idx[i]]) for i in idx]
#2楼
zip()
对于大型数组可能效率不高。 可以使用numpy.dstack()
代替zip
:
ndx = numpy.argsort(x)
values = numpy.dstack((x[ndx], y[ndx]))
#3楼
我认为您只需要指定制作最终ndarray时要排序的轴即可。 或者,对原始数组之一进行argsort,您将拥有一个索引数组,可用于在x和y中查找,这可能意味着您根本不需要任何值。
(scipy.org目前似乎无法访问,否则我会向您发布一些文档的链接)
鉴于您的描述与您的代码片段不太匹配,因此很难确定地说,但是我认为您使numpy数组的创建过于复杂。
#4楼
我认为您想要的是zip功能。 如果你有
x = [1,2,3]
y = [4,5,6]
然后zip(x,y) == [(1,4),(2,5),(3,6)]
所以你的数组可以用
a = numpy.array(zip(x,y), dtype=dtype)
#5楼
我无法使用Numpy的sort
函数获得有效的解决方案,但是还有其他可行的方法:
import numpy
x = [5,4,3]
y = [33,44,55]
r = numpy.asarray([(x[i],y[i]) for i in numpy.lexsort([x])])
lexsort
返回数组索引的排列,该排列将行按排序顺序排列。 如果要对多个键(例如,按x
然后按y
对结果进行排序,请改用numpy.lexsort([x,y])
。
#6楼
关于您的奖金问题-zip实际上也可以解压缩:
In [1]: a = range(10)
In [2]: b = range(10, 20)
In [3]: c = zip(a, b)
In [4]: c
Out[4]:
[(0, 10),
(1, 11),
(2, 12),
(3, 13),
(4, 14),
(5, 15),
(6, 16),
(7, 17),
(8, 18),
(9, 19)]
In [5]: d, e = zip(*c)
In [6]: d, e
Out[6]: ((0, 1, 2, 3, 4, 5, 6, 7, 8, 9), (10, 11, 12, 13, 14, 15, 16, 17, 18, 19))