读过很多讲解Numpy的教程后,我准备写一个Numpy系列。结合工作项目实践,以Numpy高效使用哲学为主线,重点讲解高频使用函数。
1 Numpy更高效
使用Python的地方,就能看到Numpy,尤其是需要数值计算的地方,Numpy的高性能更是体现的淋漓尽致。
它基于Python,提供远高于Python的高性能向量、矩阵和更高维度的数据结构。之所以性能高是由于它在密集型计算任务中,向量化操作是用C和Fortran代码实现。
2 导入Numpy
只需要一行代码就能导入:
在numpy包中,描述向量,矩阵和更高维度的数据集使用的术语是.
3 生成numpy数组
有许多方法能初始化一个新的numpy数组,例如:, 等,从文件中读入数据,从python的lists等都能生成新的向量和矩阵数组。例:
v和m的类型都是ndarray,这是numpy中最主要的数据结构之一
v和m的不同仅仅是它们的形状(shape), 我们能通过ndarray.shape属性发现它们的形状信息,shape属性很有用,尤其在深度学习模型调试中:
numpy中获取元素个数通过size:
4 为什么要用numpy?
到此,看起来非常像Python的list, 那我们为什么不用Python的list计算,干嘛非要创造一个新的数组(array)类型呢?
有多个原因:
Python的list是一个通用结构。Python的list能包括任意类型的对象,并且是动态类型, 它们不支持一些数学函数,比如矩阵的点乘,实现如此的函数对于Python的list而言,不会高效,因为它是动态类型
Numpy的array是静态类型和同质的,当array被创建时,元素的类型就确定
Numpy的array更节省内存
由于是静态类型,一些数学函数实现起来会更快,例如array间的加减乘除能够用C和Fortran实现
使用ndarray.dtype, 我们能看到一个数组内元素的类型:
如果我们尝试用str类型赋值给m,会报错:
创建数组时,能指定类型,通过为dtype赋值:
dtype更多取值:, , , , , 我们还可以显示的定义数据位数的类型,如:, , ,
明天推送此系列的第二篇,欢迎关注「Python3分钟」,这里全是Python和数据科学系列的好文章: