Numpy 学习
Ndarray对象
特点
-
N 维数组对象 一系列同类型数据的集合 下标从0开始
-
每个元素在内存中占有相同存储大小
-
由什么构成
- 指向数据(内存中的一块数据)的指针
- 元素的数据类型dtype,指示数组中固定大小的格子
- 表示数组形状(shape)的元组,表示每一维的大小
- 跨度元组(stride)指示前进到当前维度下一个元素需要跨多少字节长度
构造
nd.array(object, dtype = None, copy = True, order = None, subok = False, ndmin = 0 )
参数说明:
名称 | 描述 |
---|---|
object | 数组或嵌套的数列、元组(用什么来初始化n维数组) |
dtype | 数组元素的数据类型,可选 |
copy | 对象是否需要复制,可选 |
order | 创建数组的样式,C为行方向,F为列方向,A为任意方向(默认) |
subok | 默认返回一个与基类类型一致的数组 |
ndmin | 指定生成数组的最小维度 |
数据类型 dtype
numpy自带类型
-
bool_
-
int_
-
int8
-
int16
-
int32
-
int64
int8, int16, int32, int64 四种数据类型可以使用字符串 ‘i1’, ‘i2’,‘i4’,‘i8’ 代替
-
-
uint8 12 32 64
-
float_
- float16 32 64
-
complex_
- complex64 128
内建类型都有一个唯一定义它的字符代码,如下:
字符 | 对应类型 |
---|---|
b | 布尔型 |
i | (有符号) 整型 |
u | 无符号整型 integer |
f | 浮点型 |
c | 复数浮点型 |
m | timedelta(时间间隔) |
M | datetime(日期时间) |
O | (Python) 对象 |
S, a | (byte-)字符串 |
U | Unicode |
V | 原始数据 (void) |
dtype 表述数组的内存区域如何使用: 存储什么类型的数据,占有多大的内存 ,依赖于
- 数据类型
- 数据大小
- 字节顺序(大端 还是小端)
- 元素是结构化数据类型: 字段的名称、每个字段的数据类型、以及每个字段占内存的大小
- 数据类型是字数组,形状和数据类型
构造
numpy.dtype(object, align, copy)
通过自带类型的组合成自己想要的类型
-
object - 要转换为的数据类型对象
-
align - 如果为 true,填充字段使其类似 C 的结构体。 大端还是小端 可以使用’<i4’表示
-
copy - 复制 dtype 对象 ,如果为 false,则是对内置数据类型对象的引用
创建成功后表示一个结构数据类型, ndarray的每个元素都是这个类型,类似类的实例
结构化数据类型使用
-
结构化数据类型对象使用列表[]括起来, 每个数据类型用()括起来,包括字段名+ 字段值类型
dt = np.dtype([('age','i1')]) >>> dt dtype([('age', 'i1')]) >>> np.array([12, 16], dtype = dt) array([(12,), (16,)], dtype=[('age', 'i1')]) >>> arr = np.array([12, 16], dtype = dt) >>> arr['age'] array([12, 16], dtype=int8) >>> arr[0]['age'] 12
-
构建ndarray对象的时候,每个元素数据由()括起来,并按照dtype数据类型的顺序赋值
Numpy 数组属性
维度
-
秩 rank 或 轴 axis
-
axis = 0 表示第一轴, 按列看 对每一列进行操作; axis= 1 表示第二轴, 按行看,对每一行进行操作
NumPy 的数组中比较重要 ndarray 对象属性有:
属性 | 说明 |
---|---|
ndarray.ndim |
秩,即轴的数量或维度的数量 |
ndarray.shape |
数组的维度,对于矩阵,n 行 m 列 只有一个参数的话 (2,)表示有2列 可以通过直接赋值来改变维度 或者 通过 reshape |
ndarray.size | 数组元素的总个数,相当于 .shape 中 n*m 的值 |
ndarray.dtype | ndarray 对象的元素类型 |
ndarray.itemsize | ndarray 对象中每个元素的大小,以字节为单位 |
ndarray.flags | ndarray 对象的内存信息 |
ndarray.real | ndarray元素的实部 |
ndarray.imag | ndarray 元素的虚部 |
ndarray.data | 包含实际数组元素的缓冲区,由于一般通过数组的索引获取元素,所以通常不需要使用这个属性。 |
ndarray.T | 转置 |
ndarray.copy(oder) | 按order重新进行存储,直接赋值是指向同一块内存 |
创建数组
创建空数组
-
np.empty(shape, dtype = float, order = 'c')
创建一个
shape
规定的几维几列的数组, dtype 是元素数据类型,oder 是行优先还是列优先存储内存中因为没有初始化,每个元素值是随机值
-
np.zeros(shape, dtype = float, order = 'c')
默认是浮点数, 按列优先, 全0 数组
-
np.ones(shape, dtype = None, order = 'c')
数据类型可选 , 默认也是float ,全1数组
根据已有对象创建nd数组
-
通过
np.array(object, dtype=)
5个参数 -
np.asarray(a, dtype = None, order = None)
a 可以是 列表 元组、
-
numpy.frombuffer(buffer, dtype = float, count = -1, offset = 0)
用于实现动态数组。
参数说明:
参数 描述 buffer 可以是任意对象,会以流的形式读入。 dtype 返回数组的数据类型,可选 count 读取的数据数量,默认为-1,读取所有数据。 offset 读取的起始位置,默认为0。 -
numpy.fromiter(iterable, dtype, count=-1)
可迭代对象中建立 ndarray 对象,返回一维数组。
迭代对象 不知道数据类型,因此需要指定数据类型 dtype
从数值范围创建数组
-
numpy.arange(star