Numpy库速通教程典藏版 #一篇就够了系列

2401_86454468

于 2024-09-11 23:22:29 发布

阅读量728

点赞数 10

文章标签： numpy python 开发语言

本文链接：https://blog.csdn.net/2401_86454468/article/details/142152953

版权

print(“=================================”)

c = np.asarray(((1, 2), (3, 4)))

print©

print(“=================================”)

d = np.asarray((((1, 2), (3, 4)), ((5, 6), (7, 8))))

print(d)

print(“=================================”)

e = np.asarray(a)

print(e)

在这里插入图片描述

②formbuffer()方法

用formbuffer()方法创建数组，该方法的特点及优势在于，该方法接收字节流形式的参数。

语法

np.frombuffer(buffer, dtype=None, count=-1, offset=0)

buffer指实现了__buffer__方法的对象。当buffer参数值为字符串时，因为python3默认字符串是Unicode类型，所以要转换成Byte string类型，需要在原字符串前加上b。
dtype 即数据类型，默认为浮点型。
count 读取数据的数量，默认值-1表示读取所有数据。
offset 读取的起始位置，默认从0位置开始。

通过以下一系列示例，快速理解其用法。

n1 = np.frombuffer(b"12345678987654321", dtype=‘S1’)

print(n1)

print(“=================================”)

n2 = np.frombuffer(b"1234567887654321", dtype=‘S2’)

print(n2)

print(“=================================”)

n3 = np.frombuffer(b"1234567887654321", dtype=‘S4’)

print(n3)

print(“=================================”)

n4 = np.frombuffer(b"abcdefghijklmnop", dtype=‘S4’)

print(n4)

print(“=================================”)

n5 = np.frombuffer(b"abcdefghijklmnop") # 转浮点型了

print(n5)

print(n5.dtype)

在这里插入图片描述

③fromiter()方法

fromiter()方法可用于从可迭代对象(iterable) 中创建数组。

创建一个生成器

a1 = (x * 3 for x in range(6))

print(a1)

通过生成器这个可迭代对象创建数组

a2 = np.fromiter(a1, dtype=‘int’)

print(a2)

在这里插入图片描述

数据较多时这种方法比较高效。可以实现快速将生成器中的大量数据导入数组中。

a3 = np.fromiter((2, 5, 6, 8, 5, 2), dtype=‘int’)

print(a3)

a4 = np.fromiter([2, 5, 6, 8, 5, 2], dtype=‘int’)

print(a4)

在这里插入图片描述

需要注意的一点是，使用fromiter()方法时，传入的可迭代对象不能是有嵌套其他可迭代对象的可迭代对象。fromiter()方法不支持套娃。

④empty_like()方法

创建一个与给定数组相同shape的未初始化的数组

语法

empty_like(prototype, dtype=None, order=None, subok=None, shape=None)

n = np.arange(1, 7).reshape(2, 3)

print(n)

print(“===============================”)

a = np.empty_like(n)

print(a)

在这里插入图片描述

⑤zeros_like()方法

创建一个与给定数组相同shape的全零数组

语法

zeros_like(a, dtype=None, order=‘K’, subok=True, shape=None)

n = np.arange(1, 7).reshape(2, 3)

print(n)

print(“===============================”)

a = np.zeros_like(n)

print(a)

在这里插入图片描述

⑥ones_like()方法

创建一个与给定数组相同shape的全一数组

语法

ones_like(a, dtype=None, order=‘K’, subok=True, shape=None)

n = np.arange(1, 7).reshape(2, 3)

print(n)

print(“===============================”)

a = np.ones_like(n)

print(a)

在这里插入图片描述

⑦fulls_like()方法

创建一个与给定数组相同shape的指定值填充的数组

语法

full_like(a, fill_value, dtype=None, order=‘K’, subok=True, shape=None)

n = np.arange(1, 7).reshape(2, 3)

print(n)

print(“===============================”)

a = np.full_like(n, 100)

print(a)

在这里插入图片描述

2. numpy数组数据类型

======================================================================================

2.1 关于默认值（要求高时不建议使用）

通过上述方法创建数组时，上边的示例中并未指定数据类型。

通过上边的示例可以看到，不指定数据类型创建数组时，如果不是根据一个传入的具体的有数组接口方法对象来创建，则创建出的数组的数值类型默认为浮点型。其中，除了使用arange()且各个数字刚好是整数时，是个例外，得到的数组的数据类型为整数型（回顾一下上文的arange即可理解，因为arange方法与array()里边放一个 list(range(n)) 是类似的。)

关于创建数组时数据类型默认具体是怎么样的（int32, int64, float32, float64…），我现在所了解的资源中说法有很多，有的说是跟个人的操作系统有关，有的认为是保存对象所需的最小类型。目前我不清楚哪一种是对的，不过可以确定的是，我们最好在创建数组的时候，我们通常不采用默认值，最好自己指定，这样就不会产生因为数据类型带来的问题了。（如有观点或其他答案欢迎在评论区补充。）

对类型的位数有需求时，不建议使用常规的时int,float,unit指定，而后边不跟数字，也不建议使用默认值。最好自己手动指定到位。

2.2 数组数据类型表

常用的基本数据类型如下表所示：

| 类型 | 类型代码/简写 | 描述 |

| — | — | — |

| int8,uint8 | i1,u1 | 有符号和无符号的8数位整数（-128_127）（0255） |

| int16,uint16 | i2,u2 | 有符号和无符号的16数位整数（-32768_32767）（065535） |

| int32,uint32 | i4,u4 | 有符号和无符号的32数位整数（-2147483648_{2147483647）（0}4294967295） |

| int64,uint64 | i8,u8 | 有符号和无符号的64数位整数（-9223372036854775808_{9223372036854775807）（0}18446744073709551615） |

| float16 | f2 | 半精度浮点数：1个符号位，5位指数，10位尾数 |

| float32 | f4 | 标准单精度浮点数：1个符号位，8位指数，23位尾数 |

| float64 | f8 | 标准双精度浮点数：1个符号位，11位指数，52位尾数 |

| bool | ------------ | 存储一个字节的布尔值，存储True或False。（也可写为bool_） |

| complex64 | ------------ | 复数，由两个32位浮点表示（实部和虚部） |

| complex128 | 简写：complex_ | 复数，由两个64位浮点表示（实部和虚部） |

| datatime64 | ------------ | 日期和事件类型 |

| timedelta | ------------ | 两个时间类型的间隔 |

| string_ | S | ASCII字符串类型（即字节类型），eg：‘S10’ |

| unicode_ | U | Unicode类型（python3的默认字符串是Unicode类型），eg：‘U10’ |

其中unit16表示16位无符号整数，unit32表示32位无符号整数。

其中，复数不能转化为其他数值类型。

几种变换，简单了解。

print(np.int32(12.56), type(np.int32(12.56)))

print(np.float64(13), type(np.float64(13)))

print(np.complex128(1+2j), type(np.complex(1+2j)))

print(np.unicode(‘20’), type(np.unicode(‘20’)))

在这里插入图片描述

2.3 指定数据类型详解

根据上表，创建数组时，指定数据类型，可以使用类型的全名，也可以使用类型代码。

使用array()，zeros()，ones()，empty()，arange()，linspace()，logspace()，eye()等方法创建数组时都可以通过dtype参数指定数据类型。dtype默认为None。

下边通过一些调用示例，来完成这个部分的学习。

2.3.1 整数与浮点数

a1 = np.array([1.23, 2.34, 3.45, 4.56], dtype=int)

print(a1)

print(a1.dtype)

在这里插入图片描述

a2 = np.arange(0, 10, 2, dtype=‘int’)

print(a2)

print(a2.dtype)

在这里插入图片描述

（不同：a1中传入的是关键字int，a2中传入的是字符串int。达到的效果一样。）

a3 = np.linspace(100, 200, 11, dtype=‘int64’)

print(a3)

print(a3.dtype)

在这里插入图片描述

a4 = np.logspace(0, 10, 11, base=2, dtype=‘int32’)

print(a4)

print(a4.dtype)

在这里插入图片描述

a5 = np.empty([2, 3], dtype=‘i8’)

print(a5)

print(a5.dtype)

在这里插入图片描述

a6 = np.ones(10, dtype=‘i4’)

print(a6)

print(a6.dtype)

在这里插入图片描述

a7 = np.zeros(10, dtype=‘f4’)

print(a7)

print(a7.dtype)

![在这里插入图片描述]( )

print(a8)

print(a8.dtype)

在这里插入图片描述

2.3.2 字节类型

a9 = np.full((3, 4), ‘99.0’, dtype=‘S’)

print(a9)

print(a9.dtype)

a10 = np.full((3, 4), ‘99.0’, dtype=‘S2’)

print(a10)

print(a10.dtype)

a11 = np.full((3, 4), ‘aaaaaaaaaaa’, dtype=‘|S5’)

print(a11)

print(a11.dtype)

在这里插入图片描述

如图，数据类型分别是，一个字节，二个字节，五个字节。

直接指定为"S"表示S1，也可以在S前加一个竖杠"|’ 符号，这个符号可有可无。

如果传入汉字，则无法转化为字节，则发生报错。

a11 = np.full((3, 4), ‘侯小啾’, dtype=‘S5’)

print(a11)

print(a11.dtype)

报错。

在这里插入图片描述

2.3.3 字符串类型

python3的默认字符串是Unicode类型。

a12 = np.full((3, 4), ‘99.0’)

print(a12)

print(a12.dtype)

a13 = np.full((3, 4), 99.0, dtype=‘U1’)

print(a13)

print(a13.dtype)

a14 = np.full((3, 4), 99.0, dtype=‘<U3’)

print(a14)

print(a14.dtype)

a15 = np.full((3, 4), 99.0, dtype=‘U9’)

print(a15)

print(a15.dtype)

在这里插入图片描述

不指定时，则为数据中心字符串的长度的字符串类型，这里为U4，也可以写为<U4。

字符长度长短不一时，数组的数据类型由数据中最长的字符串所决定。

a16 = np.array([[‘a’, ‘aa’, ‘aaa’], [‘aaaa’, ‘aaaaa’, ‘aaaaaa’]])

print(a16)

print(a16.dtype)

在这里插入图片描述

支持汉字，这里一个汉字记为一个长度。

a17 = np.array([‘侯小啾’, ‘支持小啾’, ‘关注他！’, ‘给他四连！’])

print(a17)

print(a17.dtype)

在这里插入图片描述

最长的字符是“给他四连！”，长度为5，所以数组的数据类型为"<U5"

3. 数组的属性与操作

====================================================================================

3.1 数组的属性

为了方便快速查看数组的属性，特定义以下函数，务必带走方便在学习及编程过程中随时调用。

def print_array(name, a):

print(name)

print(a)

print('rank = ', a.ndim) # 秩，即有几个轴，几维

print('shape = ', a.shape) # 形状

print('size = ', a.size) # 数据个数

print('data type = ', a.dtype) # 数据类型

print('element size = ', a.itemsize) # 每个元素占的字节数

print('data location = ', a.data) # 数据存储的位置

print()

n = np.array([[1, 2, 3], [4, 5, 6]])

print_array(“数组n：”, n)

在这里插入图片描述

3.2 数组的重塑

3.2.1 reshape()与resize()

对数据的结果进行重塑可以使用reshape() 或 resize()方法。

这两种方法的区别在于使用reshape()不修改原数组，而resize()是对原数组进行修改。

关于reshape

新建一个一维数组

a1 = np.arange(30)

print(a1)

print(“=====================”)

一维变二维

a2 = a1.reshape((5, 6))

print(a2)

print(“=====================”)

一维变三维

a3 = a1.reshape((2, 3, 5))

print(a3)

print(“=====================”)

三维变一维

a4 = a3.reshape((30,))

print(a4)

print(“=====================”)

三维变二维

a5 = a3.reshape((5, 6))

print(a5)

在这里插入图片描述

关于resize()

a1 = np.arange(30)

print(a1)

print(“=====================”)

一维变二维

a1.resize((5, 6))

print(a1)

在这里插入图片描述

如图，用法resize()用法与reshape()一致，只是resize()直接修改了原数组a1。具体根据实践过程合理选择使用。

修改shape时，shape的每个数字相乘必须等于数组元素的个数，否则会报错。

3.2.2flatten() 与 ravel()

使用flatten()和ravel()方法，可以直接将数组从多维变为一维。

a6 = a3.flatten()

print(a6)

在这里插入图片描述

a7 = a3.ravel()

print(a7)

在这里插入图片描述

fallen()与ravel()的区别在于，fallen()得到的新数组与原数组不共享存储，即为copy过来的，所以修改a3.fallen()时不会影响a3。而ravel()得到的新数组与原数组共享存储，修改a3.ravel()时，a3会被同步修改。

3.3 数组转置

n1 = np.arange(12).reshape(3, 4)

print(n1)

print(n1.shape)

print(“=====================”)

n2 = n1.T

print(n2)

print(n2.shape)

在这里插入图片描述

3.4 数组的索引与切片

3.4.1 索引

①一维数组为例

首先创建一个一维数组

a1 = np.arange(10)

print(a1)

在这里插入图片描述

取出该数组第一个数值和最后一个数值

print(a1[0])

print(a1[-1])

在这里插入图片描述

②二维数组为例

创建一个二维数组

a2 = np.arange(12).reshape(3, 4)

print(a2)

在这里插入图片描述

取出第一“行” 和最后一“行”（这里说“行”只能用于二维数组，在更高维的数组是不准确的，不能说是行，而需要理解为是在其所有维度中，序号为第一层的维度，或者说是最外层的维度处的坐标。计数从0计起。）：

print(a2[0])

print(a2[-1])

在这里插入图片描述

取出指定位置处的元素

print(a2[1][2])

print(a2[1, 2])

在这里插入图片描述

③三维数组为例（高维）

（关于三维及其以上的高维数组，使用为描述趋于）

a3 = np.arange(30).reshape((2, 3, 5))

print(a3)

在这里插入图片描述

取出其最外层维度下的第一个对象：

print(a3[0])

在这里插入图片描述

再剥一层：

print(a3[0][1])

在这里插入图片描述

再剥一层：

print(a3[0][1][2])

在这里插入图片描述

一个括号的写法：

print(a3[0, 1, 2])

在这里插入图片描述

**重点，易混淆点！如果想要取出多个值（不用切片），则可以在括号内嵌套括号。

如下列代码，值得注意的是，这样取出的不是四个值，而是两个值。

不是在第二次取出1,2后，再分别在1,2两个行中取出2和3。而是取出的是(0,1,2)和(0,2,3)。**

print(a3[0, [1, 2], [2, 3]])

在这里插入图片描述

（这一点在学习了DataFrame的操作后后如果理解得不够透彻则容易弄混淆。）

3.4.2 切片