大家好,欢迎来到 Crossin的编程教室~
一组1000万个0~100的整数序列,用它来生成一个新的序列,要求如果原本序列中是奇数就不变,如果是偶数就变成原来的一半。
你会怎么写?
来看几份参考答案:
青铜:
def for_method(data):
result = []
for x in data:
if x % 2 == 0:
result.append(x // 2)
else:
result.append(x)
return result
(自测耗时:0.95秒)
新建一个空列表,for循环遍历原列表,依次判断每个元素,如果能被2整除就除以2添加进新列表,否则直接添加进新列表。
白银:
def lc_method(data):
return [x if x % 2 else x // 2 for x in data]
(自测耗时:0.75秒)
通过列表解析式生成新列表,不仅代码更简洁明了,耗时还变少了。
黄金:
def numpy_method(data):
arr = np.array(data)
return np.where(arr % 2 == 0, arr // 2, arr).tolist()
(自测耗时:0.90秒)
用numpy的where方法生成新的数组。看起来效率好像还不如列表解析式嘛?这是因为大部分时间都花在了列表和ndarray的转换上。如果这组序列本身就用numpy的数组来存储的话:
def numpy_array_method(data):
return np.where(data % 2 == 0, data // 2, data)
(自测耗时:0.32秒)
速度直接碾压列表解析式。
王者:
@numba.jit(nopython=True)
def numba_method(data):
result = np.copy(data)
for i in range(len(data)):
if result[i] % 2 == 0:
result[i] //= 2
return result
(自测耗时:0.65秒)
还是用for循环,不过给函数加上一个装饰器,表示用Numba JIT编译,这个看起来平平无奇的写法会有什么效果呢?好像也没有比直接用numpy快多少嘛?
别急,让我们加大剂量,把序列长度调整到1亿,优势就体现出来了。(numba:1.21秒 vs numpy:3.04秒)
你还有其他写法吗?
作者:Crossin的编程教室
Crossin的新书《码上行动:用ChatGPT学会Python编程》已经上市了。本书以ChatGPT为辅助,系统全面地讲解了如何掌握Python编程,适合Python零基础入门的读者学习。【点此查看详细介绍】
购买后可加入读者交流群,Crossin为你开启陪读模式,解答你在阅读本书时的一切疑问。
添加微信 crossin123 ,加入编程教室共同学习~
感谢转发和点赞的各位~