Numpy:Numerical Python的简称
使用工具:numpy
语言:Python3
主要特点:
- ndarray,快速,节省空间的多维数组,提供数组化的算数运算和高级的广播功能
- 使用标注数学函数对整个数组的数据进行快速运算,不需要编写循环
- 读取或者写入磁盘上的阵列数据和操作存储器映像文件的工具
- 线性代数,随机数生成,以及傅里叶变换的能力
- 集成C、C++、Fortran代码的工具
本教程的主要内容:
- 如何生成Numpy的ndarray的几种方式
- 如何存取元素
- 如何操作矩阵
- 如何合并或者拆分数据
- Numpy的通用函数
- Numpy的广播功能
使用前导入numpy
import numpy as np
note:下面所有出现的np均代表是numpy的别名
现在开始本章的教程啦。
1、如何生成numpy的ndarray的方式
1)从已有数据中进行创建
输出:
上述是单层列表嵌套,也可以多层列表嵌套
输出:
2)利用random模块生成ndarray
深度学习中,经常会对一些变量进行初始化操作,可以适当提高模型的性能,可以利用random来生成,random模块又分为多种函数:random生成0到1之间的随机数;uniform生成均匀分布随机数;randn生成标注正太分布的随机数;normal生成正太分布;shuffle随机打乱顺序;seed设置随机数种子;可以看下面的例子:
3)创建特定形状(shape)的多维数组
在数据初始化时,有时需要生成一些特殊的矩阵,如0或1的数组或者矩阵,这时可以利用np.zeros,np.ones,np.diag来实现
4)arange函数
arange([start],stop[,step], dtype=None)。根据start和stop指定的范围,以及步长step,来生成一个ndarray,start 默认为0,step可以为小数
2、存取元素
生成数据或者获取数据后,要从ndarray中读取数据,看下面的集中方法:
对于一维ndarray,可以采用Python切片的方式,和list类似操作
对于二维ndarray,读取方式如下:
结果如下:
上述通过索引来获取元素,还可以通过函数(比如choice)来获取元素
结果如下:
3、矩阵操作
深度学习中经常遇到多维数组或者矩阵的操作,numpy提供了很多相关的计算,介绍常用的方法:
结果如下:
其他numpy.linalg中的常用函数:
diag:以一维数组方式返回方阵的对角线元素
dot:矩阵乘法
trace:求迹,即计算对角线元素的和
det:计算矩阵列式
eig:计算方阵的本征值和本征向量
inv:计算方阵的逆
qr:计算qr分解
svd:计算奇异值分解svd
solve:解线性方程组Ax=b,其中A为方阵
lstsq:计算Ax=b的最小二乘解
4、数据合并与展平
在机器学习或者深度学习,经常遇到需要把多个向量或者矩阵按照某个轴方向进行合并的情况,也会遇到展平的情况(flatten),如在卷积或者循环神经网络中,在全连接之前,需要把矩阵展平。下面介绍合并或者展平的方法:
1)合并一维数组
输出:
2)多维数组的合并
输出:
np.concatenate()函数也能达到同样的效果
3、矩阵展平
输出:
5、通用函数
Numpy提供了两种基本对象,即ndarray和ufunc对象,前面介绍的内容都是ndarray,下面介绍ufunc,ufunc是universal function的缩写,是一种能够对数组的每个元素进行操作的函数。许多的cfunc函数都是c语言实现的,因此速度快。功能比math模块中的函数更加灵活。Math模块输入的是一般的标量, numpy输入的是向量或者矩阵,利用向量或者矩阵可以编码循环语句,这个特点在机器学习和深度学习中经常使用。常用的通用函数如下:
sqrt 计算序列化数据的平方根
sin,cos 三角函数
abs 计算序列化数据的绝对值
log,log10,log2 对数函数
dot 矩阵运算
exp 指数函数
cumsum,cumproduct 累计求和,求积
sum 对一个序列化数据求和
mean 计算均值
median 计算中位数
std 计算标准差
var 计算方差
corrcoef 计算相关系数
注意:使用numpy比使用math计算同样的操作,速度一般都要快
使用方法如下:
6、广播机制
广播机制(Broadcasting)是为了方便不同shape的数组(numpy库的核心数据结构)进行数学运算。广播提供了一种向量化数组操作的方法,以便在C中而不是在Python进行循环,这通常会带来高效的算法实现。广播的兼容原则为:
1)对齐尾部维度
2)shape相等or其中shape元素中有一个为1
下面举例说明:
输出:
其中将d复制扩充的操作如下(结合广播原则2):