数据分析和展示 numpy入库

最新推荐文章于 2022-02-27 20:01:26 发布

Z_sam

最新推荐文章于 2022-02-27 20:01:26 发布

阅读量307

点赞数

分类专栏：数据分析文章标签： numpy

本文链接：https://blog.csdn.net/u010553139/article/details/107333970

版权

数据分析专栏收录该内容

5 篇文章 0 订阅

订阅专栏

NumPy 库入门（是SciPy、Pandas等数据处理或科学计算库的基础）

数据维度：一维数据，二维数据，多维数据

一维数据：由对等关系的有序或无序数据构成，采用线性方式组织。

对应列表，数组和集合等概念。
例：[3.1398, 3.1349, 3.1376] 或 {3.1398, 3.1349, 3.1376}

二维数据：由多个一维数据构成，是一维数据的组合形式。
例：[[3.1398, 3.1349, 3.1376],
[3.1413, 3.1404, 3.1401]]
多维数据：由一维或二维数据在新的维度上扩展形成。
高维数据：利用最基本的二元关系展示数据间的复杂结构（键值对）
例：字典类型或数据表示格式 Json/xml/yaml

NumPy 的数组对象：ndarray

NumPy

NumPy是一个开源的Python科学计算基础库，包含：

一个强大的N维数组对象 ndarray
广播功能函数
整合C/C++/Fortran 代码的工具
线性代数、傅里叶变换、随机数生成等功能

Numpy是scipy、Pandas 等数据处理或科学计算库的基础

Numpy 的引用

import numpy as np

N维数组对象：ndarray

数组对象可以去掉元素间运算所需的循环，使一维向量更像单个数据
设置专门的数据对象，经过优化，可以提升这类应用的运算速度
数组对象采用相同的数据类型，有助于节省运算和存储空间

ndarray是一个多维数组对象，

由（实际的数据）和（描述这些数据的元数据（数据维度，数据类型等））两部分构成

ndarray数组一般要求所有元素类型相同（同质），数组下标从0开始

ndarray实例
在这里插入图片描述

ndarray对象的属性

属性	说明	例
.ndim	秩，即轴的数量或维度的数量	a.ndim或np.ndim(a)
.shape	ndarray对象的尺度，对于矩阵，n行M列	a.shape或np.shape(a)
.size	ndarray对象元素的个数，相当于.shape中的n*m的值	a.size或np.size(a)
.dtype	ndarray对象的元素类型	a.dtype
.itemsize	ndarray对象中每个元素的大小，以字节为单位	a.itemsize

ndarray的元素类型

数据类型	说明
bool	布尔类型，True或False
intc	与C语言中的int类型一致，一般是int32或int64
intp	用于索引的整数，与C语言中ssize_t一致，int32或int64
int8	字节长度的整数，取值：[-128, 127]
int16	16位长度的整数，取值：[-32768, 32767]
int32	32位长度的整数，取值：[-2^31, 2^31-1]
int64	64位长度的整数，取值：[-2^63, 2^63-1]
uint8	8位无符号整数，取值：[0, 255]
uint16	16位无符号整数，取值：[0, 65535]
uint32	32位无符号整数，取值：[0, 2^32-1]
unit64	32位无符号整数，取值：[0, 2^64-1]
float16	16位半精度浮点数：1位符号，5位指数(符号尾数*10指数)，10位尾数
float32	32位半精度浮点数：1位符号，8位指数，23位尾数
float64	64位半精度浮点数：1位符号，11位指数，52位尾数
complex64	复数类型，实部和虚部都是32位浮点数
complex128	复数类型，实部和虚部都是64位浮点数

对比：python语法只支持整数、浮点数和复数3种类型

科学计算涉及数据较多，对存储和性能都有较高要求
对元素类型精细定义，有助于Numpy合理使用存储空间并优化性能，
对元素类型精细定义，有助于程序员对程序规模有合理评估。

非同质的ndarry对象

非同质的ndayyay对象，无法发挥NumPy优势，尽量避免使用；

ndarray数组的创建

ndayyay数据的创建方法：

1、从python中的列表，元组等类型创建 ndarray 数组；
x = np.array(list/tuple)

x = np.array(list/tuple, dtype=bp.float32)

当np.array()不指定dtype时，numpy将根据数据情况关联一个dtype类型。

2、使用 NumPy中的函数创建 ndarray 数组。如：arange，ones， zeros等

函数	说明
np.arange(n)	类似range()函数，返回ndarray类型，元素从0到n-1
np.ones(shape)	根据shape 生成全1数组，shape是元组类型
np.zeros(shape)	根据shape 生成全0数组，shape是元组类型
np.full(shape,val)	根据shape生成一个数组，每个元素值都是val
np.eye(n)	创建一个正方n*n单位矩阵，对角线为1，其余为0
np.ones_like(a)	根据数组a的形状生成一个全1数组
np.zeros_like(a)	根据数组a的形状生成一个全0数组
np.full_like(a,val)	根据数组a的形状生成一个数组，每个元素值都是val
np.linspacs()	根据起止数据等间距地填充数据，形成数组
np.concatenate()	将两个或多个数组合并成一个新的数组

3、从字节流（raw bytes）中创建 ndarray 数组。
4、从文件中读取特定格式，创建 ndarray 数组。

ndarray数组的变换

对于创建后的ndarray数组，可以对其进行维度变换和元素类型变换。

a = np.ones((2,3,4),dtype=np.int32)

ndarray数组的维度变换

函数	说明
.reshape(shape)	不改变数组元素，返回一个shape形状的数组，原数组不变
.resize(shape)	与.reshape()功能一致，但*修改*原数组
.swapaxes(ax1,ax2)	将数组n个维度中两个维度进行调换
.flatten()	对数组进行降维，返回折叠的一维数组，原数组不变。

a = np.ones((2,3,4),dtype=np.int32)

a
Out[69]: 
array([[[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]],

       [[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]]])
a.reshape(3,8)
Out[70]: 
array([[1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1]])
a
Out[71]: 
array([[[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]],

       [[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]]])

a.resize(3,8)

a
Out[73]: 
array([[1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1]])
b
Out[5]: 
array([[[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]],

       [[12, 13, 14, 15],
        [16, 17, 18, 19],
        [20, 21, 22, 23]]])

b.flatten()
Out[6]: 
array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,
       17, 18, 19, 20, 21, 22, 23])

ndarray数组的类型变换

new_a = a.astype(new_type)

astype()方法一定会创建新的数据（原始数据的一个拷贝），即使两个类型一致

ndarray数组向列表的变换

ls = a.tolist()

a
Out[7]: 
array([[[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]],

       [[12, 13, 14, 15],
        [16, 17, 18, 19],
        [20, 21, 22, 23]]])
ls = a.tolist()

ls
Out[9]: 
[[[0, 1, 2, 3], [4, 5, 6, 7], [8, 9, 10, 11]],
 [[12, 13, 14, 15], [16, 17, 18, 19], [20, 21, 22, 23]]]

ndarray数组的操作

数组的索引和切片

索引：获取数组中特定位置元素的过程
切片：获取数组元素子集的过程

一维数组的索引和切片：与python列表操作类似。
在这里插入图片描述

多维数组的索引：
在这里插入图片描述
多维数组的切片：

ndarray 数组的运算

数组与标量之间的运算

数组与标量之间的运算作用于数组的每一个元素。
np.mean()数组平均值的商

NumPy 一元函数

对ndarray中的数据执行元素级运算的函数

函数	说明
np.abs(x) 、 np.fabs(x)	计算数组各元素的绝对值
np.sqrt(x)	计算数组各元素的平方根
np.square()	计算数组各元素的平方
np.log(x)、 np.log10(x) 、np.log2(x)	计算数组各元素的自然对数，10底对数和2底对数
np.ceil(x)、 np.floor(x)	计算数组各元素的ceiling值或floor值
np.rint(x)	计算数组各元素的四舍五入值
np.modf(x)	将数组各元素的小数和整数部分以两个独立数组形式返回
np.cos(x)、 np.cosh(x) 、np.sin(x) 、np.sinh(x) 、np.tan(x) 、np.tanh(x)	计算数组各元素的普通型和双曲线型三角函数
np.exp(x)	计算数组各元素的指数值
np.sign(x)	计算数组各元素的符号值，1(+), 0, -1(-)

NumPy 二元函数

函数	说明
+ - * / **	两个数组各元素进行对应运算
np.maximum(x,y) 、np.fmax() 、np.minimum(x,y) 、np.fmin()	元素级的最大值/最小值计算
np.mod(x,y)	元素的摸运算
np.copysign(x,y)	将数组y中各元素的符号赋值给数组x对应元素
> < >= <= == !=	算术比较，产生布尔型数组

小结

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-a7BODnOP-1594695758229)(C:\Users\zzk\AppData\Roaming\Typora\typora-user-images\image-20200714104919277.png)]

-------------------DV02 NumPy数据存取与函数-------------------

数据的CSV文件存取

csv保存
np.savetxt(frame, array, fmt=’%.18e’, delimiter=None)
frame: 文件、字符串或产生器，可以是.gz或.bz2的压缩文件
array:存入文件的数组
fmt:写入文件的格式，例如：%d（整数） %.2f（浮点） %.18e（科学计数）
delimiter:分割字符串，默认是任何空格

csv读取
np.loadtxt(frame, dtype=np.float, delimiter=None, unpack=False)
frame:文件、字符串或产生器，可以是.gz或.bz2的压缩文件
dtype:数据类型，可选
delimiter:分割字符串，默认是任何空格
unpack:如果是True，读入属性将分别写入同变量
b = np.loadtxt(‘a.csv’,ptype=np.int,delimiter=’,’)

csv文件的局限性
csv只能有效存储一维和二维数组
np.savetxt() np.loadtxt()只能有效存取一维和二维数组

任意维度数据如何存取
a.tofile(frame, sep=’’, format=’%s’)
frame:文件、字符串
sep:数据分割字符串，如果是空串，写入文件为二进制
format:写入数据的格式
例：
a = np.arange(100).reshape(5,10,2)
a.tofile(‘b.dat’,sep=’,’,format=’%d’)

np.fromfile(frame, dtype=float, count=-1, sep=’’)
frame:文件、字符串
dtype:读取的数据类型
count:读入元素个数。-1表示读入整个文件
sep:数据分割字符串，如果是空串，写入文件为二进制

NumPy的随机数函数

NumPy的随机数函数子库
np.random.*
np.random.rand()
np.ramdom.randn()
np.ramdom.randint()

rand(d0,d1,…,dn):根据d0-dn创建随机数数组，浮点数，[0,1],均匀分布
randn(d0,d1,…,dn):根据d0-dn创建随机数数组，标准正态分布
randint(low[,high,shape]):根据shape创建随机整数或整数数组，范围是[low，high]
seed(s):随机数种子，s是给定的种子值

shuffle(a):根据数组a的第1轴进行随机排列，改变数组x
permutation(a):根据数组a的第1轴产生一个新的乱序数组，不改变数组x
choice(a[,size,replace,p]):从一堆数据组a中以概率p抽取元素，形成size形状新数组

uniform(low,high,size):产生具有均匀分布的数组，low起始值，high结束值，size形状
normal(loc,scale,size):产生具有均匀分布的数组，loc均值，scale标准差，size形状
poisson(lam,size):产生具有泊松分布的数组，lam随机事件发生率，size形状

NumPy的统计函数

NumPy直接提供的统计函数
np.*
np.std() np.var() np.average()
np.sum(a, axis=None):根据给定轴axis计算数组a相关元素之和，axis整数或元组
np.mean(a, axis=None):根据给定轴axis计算数组a相关元素的期望，axis整数或元组
np.average(a,axis=None,weights=None):根据给定轴axis计算数组a相关元素的加权平均值
np.std(a, axis=None):根据给定轴axis计算数组a相关元素的标准差
np.var(a, axis=None):根据给定轴axis计算数组a相关元素的方差
注意：axis中0,1分别代表纵轴和横轴

np.min(a) np.max(a):计算数组a中元素的最小值，最大值
np.argmin(a) np.argmax(a):计算数组a中元素的最小值，最大值的降一维后下标
np.unravel_index(index, shape):根据shape将一维下标index转换成多维下标
np.ptp(a):计算数组a中元素最大值与最小值的差
np.median(a):计算数组a中元素的中位数（中值）

NumPy的梯度函数

np.gradient(f):计算数组f中元素的梯度，当f为多维时，返回每个维度梯度
梯度：连续值之间的变化率，即斜率
XY坐标轴连续三个X坐标对应的Y轴值：a,b,c 其中，b的梯度是：(c-a)/2
a = np.random.randint(0,20,(5))

Z_sam

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据分析和展示 numpy入库

NumPy 库入门（是SciPy、Pandas等数据处理或科学计算库的基础）数据维度：一维数据，二维数据，多维数据一维数据：由对等关系的有序或无序数据构成，采用线性方式组织。对应列表，数组和集合等概念。例：[3.1398, 3.1349, 3.1376] 或 {3.1398, 3.1349, 3.1376}二维数据：由多个一维数据构成，是一维数据的组合形式。例：[[3.1398, 3.1349, 3.1376],[3.1413, 3.1404, 3.1401]]多维数据：由一维或
复制链接

扫一扫