简述python常用数据分析库之numpy
一、NumPy简介
NumPy(Numeric Python) 是Python 中科学计算的基础包。它是一个Python库,提供了多维数组对象和各种派生对象,以及快速操作的各种函数,包括数学、逻辑、形状操作、排序、选择、傅立叶变换、基本线性代数、基础统计运算、随机模拟等。
NumPy 的底层使用C 语言编写,并且在内部实现了对Python解释器锁(PIL)的解锁,使其并行运算的效率远高于Python 的基础数据结构。它同时也作为许多数据分析库、科学计算库、机器学习算法库的底层库。NumPy 有超过10年的历史,核心算法经过了长时间、多人次的验证,非常稳定,并且NumPy的扩展性非常好,可以很容易集成到其他语言(Java,C#)中。
NumPy的核心是 ndarray 对象,该对象是一个N维数组对象(N-dimensionarray)。它是一个快速而灵活的大数据集容器,该对象由两部分组成。
(1)实际的数据
(2)描述这些数据的元数据
大部分的 ndarray 操作仅仅是修改元数据部分,而不会改变其底层的实际数据。可以直接将 ndarray 看作一种新的数据类型,就像list、tuple、dict 一样。但在 ndarray 中,所有元素的数据类型必须是一致的。
二、NumPy常用属性和方法
属性 | 名描述 |
---|---|
dtype | 描述数组中元素的类型 |
shape | 以tuple 的形式,表示数组的形状 |
ndim | 数组的维度 |
size | 数组中元素的个数 |
itemsize | 数组中元素在内存所占字节数 |
T | 数组的转置 |
flat | 返回一个数组的迭代器,对flat 赋值将导致整个数组的元素被覆盖 |
nbytes | 数组占用的存储空间 |
三、实例演示
首先需引入 numpy 库,取别名为 np
import numpy as np
演示代码,在 jupyter 中操作
①指定数组维度 ndim :
②指定数据中元素类型 dtype :
指定为复数类型:
指定类型为对象:
③切分数组 shape :
④索引
按 ( x ,y) 坐标取值: