Numpy库
NumPy 是一个运行速度非常快的数学库,主要用于数组计算,包含:
-
一个强大的N维数组对象 ndarray
-
广播功能函数
-
整合 C/C++/Fortran 代码的工具
-
线性代数、傅里叶变换、随机数生成等功能
安装Numpy库
pip install numpy
引用Numpy库
import numpy as np
##Numpy的数据结构##
n维数组对象:ndarray(所有元素的数据类型必须一致,提高数据处理效率)
数据的维度
-
维度:一组数据的组织形式
-
N维数组的维度叫轴(axis),轴的个数叫秩(rank)
-
一维数据 :列表,数组,集合等
-
二维数据:由多个一维数据构成,是一维数据的组合形式(表格)
-
多维数据:由一维和二维数据在新维度上扩展形成
-
高维数据:仅利用最基本的二元关系展示数据间的复杂结构(键值对)
-
数组与列表的区别:
-
列表:数据类型可以不同
-
数组:数据类型相同 (也可不同,最好不要!)
ndarray对象的属性
- .ndim : 秩,即轴的数量或维度的数量
- .shape: ndarray对象的尺度,对于矩阵,n行m列
- .size : ndarray对象元素的个数,相当于.shape中n*m的值
- .dtype : ndarray对象的元素类型
- .itemsize : ndarray对象中每个元素的大小,以字节为单位
查看相关属性
print(array)
print('number of dim:',array.ndim)
print('shape:',array.shape)
print('size',array.size)
运行效果
ndarray的元素类型
- boll: 布尔类型,True or False
- intc: 与C语言中的int类型一致,一般为int32 or int64
- intp: 用于索引的整数,与C语言中ssize_t一致, int32 or int64
- int8 : 字节长度的整数,取值:[-128,127]
- int16: 16字节长度的整数,取值:[-32768,32767]
- int32: 32字节长度的整数,取值:[-2^31, 2^31 -1]
- int64: 64字节长度的整数,取值:[-2^63, 2^63 -1]
- uint8 : 8位无符号整数,取值:[0,255]
- uint16 : 16位无符号整数,取值: [0,65535]
- uint32 : 32位无符号整数,取值: [0,2^32 -1]
- uint64 : 64位无符号整数,取值:[0,2^64 -1]
- float16 : 16位半精度浮点数,1位符号位,5位指数,10位尾数
- float32 : 32位半精度浮点数,1位符号位,8位指数,23位尾数
- float64 : 64位半精度浮点数,1位符号位,11位指数,52位尾数
- complex64 : 复数类型,实部和虚部都是32位浮点数
- complex128 : 复数类型,实部和虚部都是64位浮点数
ndarray数组的创建方法
从python中的列表、元组等类型创建ndarray数组
x = np,array(list/tuple)
x = np.array(list/tuple,dtype=np.float32)
- 当np.array不指定dtype时NumPy将根据数据情况关联一个dtype类型
###使用Numpy中函数创建ndarray数组###
np.arange(n) : #返回ndarray类型,元素从0到n-1
np.ones((m,n),dtype): #根据shape生成一个全1的数组,shape是元组类型
np.zeros((m,n),dtype): #根据shape生成一个全0的数组,shape是元组类型
np.full(shape,val): #根据shape生成一个数组,每个元素值都是val
np.eye(n) : #创建一个正方的n*n单位矩阵,对角线为1,其余为0
np.ones_like(a) : #根据数组a的形状生成一个全1数组
np.zeros_like(a) : #根据数组a的形状生成一个全0数组
np.full_like(a,val) : #根据数组a的形状生成一个数组,每个元素值都是val
np.linspace(起始值,结束值,元素个数,endpoint= T or F ) : #根据起止数据等间距地填充数据,形成数组 endpoint表示结束值是否为最后一个元素
np.concatenate() : 将两个或多个数组合并成一个新的数组
np.indices((m,n)) : #创建一个m行n列的矩阵
np.random.rand(m,n) #创建一个m行n列的随机数组
np.random.randn(m,n) : #创建一个m行n列的随机数组
np.random.rand() #产生0-1均匀分布的随机数数组
np.random.randn() #产生0-1标准正态分布的随机数数组
np.random.randint(low[,high,shape]) #根据shape创建随机整数数组,范围[low,high)
np.random.seed(s) #随机数种子,s为给定的种子值
ndarray数组的的维度变换
- .reshape(shape) : 不改变数组元素,返回一个shape形状的数组,原数组不变
- .resize(shape) : 与.reshape()功能一致,但修改原数组
- .swapaxes(ax1,ax2) : 将数组n个维度中的两个维度进行调换
- .flatten() : 对数组进行降维,返回折叠后的一堆数组,原数组不变
ndarray数组的类型变换
new_a = a.astype(new_type )
ndarray数组向列表的转换
ls = a.tolist()
数组的索引和切片
-
一维数组
a = np.array([1,2,3,4,5,6,7]) a[2] out: 3 a[1:4:2] out: array[2,4]
-
多维数组
a = array([[[0 ,1 ,2 ,3 ], [4, 5, 6, 7], [8, 9, 10 ,11]], [[12 ,13 ,14 ,15 ], [16, 17, 18, 19], [20, 21, 22 ,23]]]) a[1,2,3] out: 23 a[0,1,2] out:6 a[-1,-2,-3] out:17 a[:,1,-3] out: array([5,17]) a[:,1:3,:] out: array([[[4 ,5 , 6, 7], [8, 9, 10 ,11]], [16 ,17, 18, 19], [20, 21, 22, 23]]]) a[ : , : , : : 2] out: array([[[ 0 , 2], [ 4 , 6], [ 8 ,10]], [[12, 14], [16, 18], [20,22]]])
-
还可按条件进行切片
a[条件]
数组与标量之间的运算
- 数组与标量之间的运算作用于数组的每一个元素
NumPy一元函数
对ndarray中的数据执行元素级运算的函数
np.abs(x) np.fabs(x): #计算数组各元素的绝对值
np.sqrt(x) : #计算数组各元素的平方根
np.square(x) : #计算数组各元素的平方
np.log(x) np.log10(x) np.log2(x) : #计算数组各元素的自然对数、10底对数和2底对数
np.ceil(x) np.floor(x) : #计算数组各元素的ceiling值or floor值
np.rint(x) : #计算各元素的四舍五入值
np.modf(x) : #将数组各元素的小数和整数部分以两个独立数组形式返回
np.cos(x) np.cosh(x) : #计算各元素的普通型和双曲型三角函数
np.sin(x) np.sinh(x) : #计算各元素的普通型和双曲型三角函数
np.tan(x) np.tanh(x) : #计算各元素的普通型和双曲型三角函数
np.exp(x) : #计算数组各元素的指数值
np.sign(x) : #计算数组各元素的符号值
NumPy二元函数
+-*/** #两个数组各元素进行对应运算
np.maximum(x,y) np.fmax()
np.minimum(x,y) np.fmin() #元素级的最大值最小值计算
np.mod(x,y) 元素级的模运算
np.copysign(x,y) 将数组y中各元素值的符号赋值给数组x对应的元素
<>>=<= == != #算术比较,产生布尔型数组
从外部数据源读入数据生成数组
###从csv文件读入与数据###
import numpy as np
c = np.loadtxt(‘name’, dtype=’ ‘,
delimiter=’,’,usecols= ,skiprows= ,unpack= )
-
fname是文件名,数据类型为字符串str;
-
dtype是数据类型
-
delimiter是分隔符,数据类型为字符串str;
-
usecols是读取的列数,数据类型为元组tuple,其中元素个数有多少个,则选出多少列;
-
skiprows是需要跳过的行数
-
unpack是是否解包,数据类型为布尔bool,默认为False
’ ‘,
delimiter=’,’,usecols= ,skiprows= ,unpack= )
-
fname是文件名,数据类型为字符串str;
-
dtype是数据类型
-
delimiter是分隔符,数据类型为字符串str;
-
usecols是读取的列数,数据类型为元组tuple,其中元素个数有多少个,则选出多少列;
-
skiprows是需要跳过的行数
-
unpack是是否解包,数据类型为布尔bool,默认为False