说明:本blog基于python3版本, numpy 1.19.5版本
前言
numpy, 全程numerical python, 是目前python数值运算中最为重要的基础包。本文主要对比使用numpy和python的循环方法对大量数据进行运算的效率情况。
上料
首先,我们分别使用numpy和list定义一个10,000,000大小的数据,代码如下
【注:需要提前请安装numpy库,详情可参照】
import numpy as np
np_array = np.arange(10000000)
py_list = list(range(10000000))
然后,我们对两个数据中的每个元素进行平方操作,并计时
import time
np_array_sta=time.time()
np_array = np.square(np_array)
np_array_end=time.time()
print('totally cost in np_array :',np_array_end - np_array_sta)
py_list_sta=time.time()
py_list = [i **2 for i in py_list]
py_list_end=time.time()
print('totally cost in py_list :',py_list_end - py_list_sta)
结果如下,
totally cost in np_array : 0.031244754791259766
totally cost in py_list : 2.889944553375244
由此可见, 做相同的运算,在numpy和直接用python的循环方法差别还是蛮大的,numpy的速度是python方法的10-100倍(经验值);这也就是为什么大家喜欢使用numpy而不是直接使用python方法进行数据处理的重要原因;从底层原理来讲,numpy把数据存储到内存上,每次处理数据无需做数据类型验证和其他管理操作是计算效率高的根本原因,同时,numpy存储数据所需要的空间比直接用python方法命名的数据所需空间更小~
总结
写在最后,希望本blog对你深入了解Numpy有所帮助,欢迎点赞讨论~