python输入数字成数组_python – Numpy:将数值插入数组的最快方法,使得数组按顺序排列...

假设我有一个数组my_array和一个奇异值my_val. (请注意,my_array始终排序).

my_array = np.array([1, 2, 3, 4, 5])

my_val = 1.5

因为my_val是1.5,我想把它放在1和2之间,给我数组[1,1.5,2,3,4,5].

我的问题是:当my_array任意增大时,生成有序输出数组的最快方式(即以微秒为单位)是什么?

我原来的方式是将值连接到原始数组然后排序:

arr_out = np.sort(np.concatenate((my_array, np.array([my_val]))))

[ 1. 1.5 2. 3. 4. 5. ]

我知道np.concatenate很快但我不确定np.sort如何随着my_array的增长而扩展,即使my_array总是会被排序.

编辑:

我已经为接受答案时列出的各种方法编制了时间:

输入:

import timeit

timeit_setup = 'import numpy as np\n' \

'my_array = np.array([i for i in range(1000)], dtype=np.float64)\n' \

'my_val = 1.5'

num_trials = 1000

my_time = timeit.timeit(

'np.sort(np.concatenate((my_array, np.array([my_val]))))',

setup=timeit_setup, number=num_trials

)

pauls_time = timeit.timeit(

'idx = my_array.searchsorted(my_val)\n'

'np.concatenate((my_array[:idx], [my_val], my_array[idx:]))',

setup=timeit_setup, number=num_trials

)

sanchit_time = timeit.timeit(

'np.insert(my_array, my_array.searchsorted(my_val), my_val)',

setup=timeit_setup, number=num_trials

)

print('Times for 1000 repetitions for array of length 1000:')

print("My method took {}s".format(my_time))

print("Paul Panzer's method took {}s".format(pauls_time))

print("Sanchit Anand's method took {}s".format(sanchit_time))

输出:

Times for 1000 repetitions for array of length 1000:

My method took 0.017865657746239747s

Paul Panzer's method took 0.005813951002013821s

Sanchit Anand's method took 0.014003945532323987s

对于长度为1,000,000的数组,重复100次:

Times for 100 repetitions for array of length 1000000:

My method took 3.1770704101754195s

Paul Panzer's method took 0.3931240139911161s

Sanchit Anand's method took 0.40981490723551417s

解决方法:

使用np.searchsorted以对数时间查找插入点:

>>> idx = my_array.searchsorted(my_val)

>>> np.concatenate((my_array[:idx], [my_val], my_array[idx:]))

array([1. , 1.5, 2. , 3. , 4. , 5. ])

注1:我建议查看@Willem Van Onselm和@ hpaulj的深刻见解.

注意2:如果所有数据类型从头开始匹配,则使用@Sanchit Anand建议的np.insert可能会稍微方便一些.然而,值得一提的是,这种便利是以巨大的开销为代价的:

>>> def f_pp(my_array, my_val):

... idx = my_array.searchsorted(my_val)

... return np.concatenate((my_array[:idx], [my_val], my_array[idx:]))

...

>>> def f_sa(my_array, my_val):

... return np.insert(my_array, my_array.searchsorted(my_val), my_val)

...

>>> my_farray = my_array.astype(float)

>>> from timeit import repeat

>>> kwds = dict(globals=globals(), number=100000)

>>> repeat('f_sa(my_farray, my_val)', **kwds)

[1.2453778409981169, 1.2268288589984877, 1.2298014000116382]

>>> repeat('f_pp(my_array, my_val)', **kwds)

[0.2728819379990455, 0.2697303680033656, 0.2688361559994519]

标签:python,sorting,concatenation,numpy

来源: https://codeday.me/bug/20190527/1162537.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值