一、numpy 概述
Numpy(Numerical Python):是一个开源的Python科学计算库,用于快速处理任意维度的数组,Numpy支持常见的数组和矩阵操作
- 对于同样的数值计算任务,用Numpy比直接用Python要简洁的多,Numpy使用ndarray对象来处理多维数组,该对象是一个快速而灵活的大数据容器
- 提供一个N维数组类型ndarray,它描述了相同类型的“items”的集合
- 生成numpy对象:np.array()
2.1用ndarray进行存储数组
import numpy as np
# 创建ndarray
number = np.array(
[[88, 89, 87, 67, 79],
[90, 94, 78, 67, 74],
[91, 91, 90, 67, 69],
[76, 87, 75, 67, 86],
[94, 92, 93, 67, 64]
])
number
结果如下
机器学习特点:大量的数据运算,若无快速的解决方案,python在机器学习领域可能也达不到好的效果
Numpy专门针对ndarray的操作和运算进行了设计,所以数组的存储效率和输入输出性能远优于Python中的嵌套列表,数组越大,Numpy的优势就越明显
2.2 ndarray优势
- 内存块风格:ndarray存储数据时数据与数据的地址都是连续的,使得批量操作数组元素时速度更快,其原因在于
- ndarray中所有元素的类型都是相同的,在存储元素时内存可以连续(一体式存储,存储类型相同)
- 而python原生list中的元素类型是任意的,只能通过寻址方式找到下一个元素(分离式存储,存储内容多样化)
- 这虽然导致了在通用性能方面Numpy的ndarray不及Python原生list,但在科学计算中,ndarray可以省掉很多循环语句,代码使用方面比Python原生list简单的多
- 支持并行化运算(向量化运算):numpy内置了并行运算功能,当系统有多个核心时,做某种计算时,numpy会自动做并行计算
- 效率远高于纯python代码:Numpy底层使用C语言编写,内部解除了GIL(全局解释器锁),其对数组的操作速度不受Python解释器的限制,所以,其效率远高于纯Python代码
import random
import time
import numpy as np
a = []
for i in range(100000000):
a.append(random.random())
# 通过%time魔法方法, 查看当前行的代码运行一次所花费的时间
%time sum1=sum(a) # 原生Python计算时间
b=np.array(a)
%time sum2=np.sum(b) # numpy计算时间
结果如下
二、n维数组-ndarray
2.1 ndarray属性
数组属性反映了数组本身固有的信息
属性名字 | 属性解释 |
---|---|
ndarray.shape | 数组维度的元组 |
ndarray.ndim | 数组维数 |
ndarray.size | 数组中的元素数量 |
ndarray.itemsize | 一个数组元素的长度(字节) |
ndarray.dtype | 数组元素的类型 |
import numpy as np
# 创建ndarray
number = np.array(
[[88, 89, 87, 67, 79],
[90, 94, 78, 67, 74],
[91, 91, 90, 67, 69],
[76, 87, 75, 67, 86],
[94, 92, 93, 67, 64]
])
print(number.shape) # (5, 5)
print(number.ndim) # 2
print(number.size) # 25
print(number.itemsize) # 4
number.dtype # dtype('int32')
输出如下
2.2 数组维数形状
a = np.array([[1,2,3],[4,5,6]]) # 二维数组
a.shape # (2, 3)
b = np.array([1,2,3,4,5]) # 一维数组
b.shape # (5,)
c = np.array([[[1,2,3],[4,5,6]],[[1,2,3],[4,5,6]]]) # 三维数组
c.shape # (2, 2, 3)
结果如下
2.3 ndarray数组类型
名称 | 描述 | 简写 |
---|---|---|
np.bool | 用一个字节存储的布尔类型(True或False) | 'b' |
np.int8 | 一个字节大小,-128 ~ 127 | 'i' |
np.int16 | 整数,-32768 ~ 32767 | 'i2' |
np.int32 | 整数,-2^31 ~ 2^32 -1 | 'i4' |
np.int64 | 整数,-2^63 ~ 2^63 - 1 | 'i8' |
np.uint8 | 无符号整数,0 ~ 255 | 'u' |
np.uint16 | 无符号整数,0 ~ 65535 | 'u2' |
np.uint32 | 无符号整数,0 ~ 2^32 - 1 | 'u4' |
np.uint64 | 无符号整数,0 ~ 2^64 - 1 | 'u8' |
np.float16 | 半精度浮点数:16位,正负号1位,指数5位,精度10位 | 'f2' |
np.float32 | 单精度浮点数:32位,正负号1位,指数8位,精度23位 | 'f4' |
np.float64 | 双精度浮点数:64位,正负号1位,指数11位,精度52位 | 'f8' |
np.complex64 | 复数,分别用两个32位浮点数表示实部和虚部 | 'c8' |
np.complex128 | 复数,分别用两个64位浮点数表示实部和虚部 | 'c16' |
np.object_ | python对象 | 'O' |
np.string_ | 字符串 | 'S' |
np.unicode_ | unicode类型 | 'U' |
创建数组时可指定类型,若不指定,整数默认int64,小数默认float64,演示如下
学习导航:http://xqnav.top/