在一个例子中说明优化的考量。
给定一个整数数组 nums 和一个目标值 target,请你在该数组中找出和为目标值的那两个整数,并返回他们的数组下标。你可以假设每种输入只会对应一个答案。但是,数组中同一个元素不能使用两遍。
例如,给定 nums = [2, 7, 11, 15], target = 9
因为 nums[0] + nums[1] = 2 + 7 = 9
所以返回 [0, 1]
1、暴力搜索
在数组num中,查看所有第i个元素与第j个元素num[i] + num[j]之和是否等于target,j的取值从i+1到n-1。
import numpy as np
# 用循环实现暴力搜索,太慢
def twoSum0(nums, target):
n = len(nums)
for i in range(n-1):
for j in range(i+1, n):
if nums[i] + nums[j] == x:
return [i, j]
return []
a = range(10000)
t = 19997
%time twoSum0(a,t)
运行结果
Wall time: 14.5 s
2、代码外提
在循环体内,多次判断 nums[i] + nums[j] == x 是否成立。如果改成判断 nums[j] == x - nums[i],可以看出,在内重循环中 x - nums[i] 始终不变,所以可把这一步运算移到到内重循环之外提前进行,以减少算术运算的执行次数。
def twoSum1(nums, target):
n = len(nums)
for i in range(n-1):
x = target - nums[i]
for j in range(i+1, n):
if nums[j]==x:
return [i, j]
return []
a = range(10000)
t = 19997
%time twoSum1(a,t)
运行结果表明,有一定的效果
Wall time: 6.86 s
3、用列表式替代循环
列表式用来计算列表。如果已知表a,则用列表式 b = [f(x) for x in a] 就能根据a的元素计算出一个新的列表式。列表式的语法十分紧凑,用它写出来的代码便于阅读,但只适合于编写短小的代码。
def twoSum2(nums, target):
return [[i, j]
for i in range(len(nums)-1)
for j in range(i+1, len(nums))
if target-nums[i]==nums[j]
]
a = range(10000)
t = 19997
%time twoSum2(a,t)
运行结果有些意外:太慢了。
Wall time: 14.5 s
4、用广播
用广播运算得到所有配对之和的矩阵。然后,在和矩阵里搜索target。这种方法避免了直接编写python的循环。
def twoSum3(nums, target):
a = np.array([nums]).T + nums
return list(np.argwhere(a==target)[0])
a = range(10000)
t = 19997
%time twoSum3(a,t)
运行结果
Wall time: 558 ms
如何理解这里的广播操作?再来看一个简单的例子。其中,a + b包含了a的任何一个元素与b的任何一个元素之和。有了所有元素对的和,即1、2、3分别加上10、20、30。
a = np.array([[1,2,3]])
b = a.T*10
print('a =')
print(a)
print()
print('b = ')
print(b)
print()
print('a + b = ')
print(a+b)
运行结果
a =
[[1 2 3]]
b =
[[10]
[20]
[30]]
a + b =
[[11 12 13]
[21 22 23]
[31 32 33]]
5、改写内重循环
在twoSum1中,用内重循环在数组中查找加数,可改为调用list的index函数进行查找。
def twoSum4(nums, target):
n = len(nums)
for i in range(n-1):
try:
j = nums.index(target-nums[i])
return [i, j]
except Exception as e:
continue
return []
%time twoSum4(a,t)
运行结果有明显提升,可见用系统函数来替代python循环的效用。
Wall time: 9.53 ms
还可考虑用enumerate来改写外重循环,可能会有一些提高。
def twoSum5(self, nums, target):
for i, x in enumerate(nums):
try:
j = nums.index(target-x)
return [i, j]
except:
continue
return []
6、用字典实现搜索
实现搜索时,在很多情况下,用index比用字典慢,所以再改进一下,用字典实现内重循环。
def twoSum6(nums, target):
a_dict = dict(enumerate(nums))
n = len(nums)
for i in range(n-1):
j = a_dict.get(target - nums[i])
if j is not None and i != j:
return [i, j]
%time twoSum6(a,t)
运行结果表明,效果还不错
Wall time: 2.99 ms