python数据分析与展示之ndarray数据的维度

无你想你

已于 2022-08-30 22:46:45 修改

阅读量2.5k

点赞数 1

分类专栏： python数据分析文章标签： python 数据分析开发语言

于 2022-07-27 15:28:32 首次发布

本文链接：https://blog.csdn.net/qq_62904883/article/details/126008789

版权

python数据分析专栏收录该内容

10 篇文章 3 订阅

订阅专栏

ndarray的使用和学习

学习目标：
学习内容：
内容小节：

学习目标：

学习python数据分析与展示

所采用到的课程链接是北理-Python数据分析与展示-Numpy、Matplotlib、Pandas

学习内容：

数据ndarray

数据的维度

提出数据的维度,维度表示一组数据的组织形式,可以对内部数据进行一维数据,二维数据等各个方式进行解释
一维数据由对等关系的有序或无序的数据结果组成,所以通过采用线性排序方式组织来对应列表,数组和集合等概念

1.列表和数组

一组数据的有序结构
列表数据类型可以不同,数组数据类型相同

2.二维以及多维数据

在一维以及二维数据等程度上仍然可以增加维度,称为多维数据,或者叫高维数据,比如可以增加时间维度

Numpy的数组对象:ndarray

Numpy的简单介绍

强大的N维数组对象:ndarray
广播功能函数
是结合了C等代码的工具
可以进行线性代数,傅里叶变换等功能的操作

Numpy的使用

这里我使用到的是jupyter notebook进行演示,Numpy的下载的话就是pip install+需要的模块,这里的pip可能要看是什么样的系统,有一些可能是pip3
引入Numpy的模块如下

import Numpy as np

一般简写名字的话都是简写成np方便其他人在看我们自己写的代码的时候可以方便理解
在这里,我们为什么要引入数组对象类型?
这里举一个具体的例子如下

def sum():
    a=[1,2,3,4,6,6]
    b=[7,12,4,5,6,7]
    c=[]
    for i in range(len(b)):
        c.append(a[i]**2+b[i]**3)
    return c
print(sum())

这里使用到的是一个循环进行计算,但是使用了ndarray数组时候,就可以方便,并且起到简化代码以及节约空间的作用,可以理解为将其理解为更加人性化,下面使用ndarray实现上面的内容

import numpy as np
def nsum():
    a=np.array([1,2,3,4,6,6])
    b=np.array([7,12,4,5,6,7])
    c=a**2+b**3
    return c
print(nsum())

得出的结果都是如下

[ 344 1732   73  141  252  379]

可以得出使用数组对象的原因如下

数组对象可以去掉元素之间运算的循环,使得一维向量更像是单个数据
设置专门的数组对象,经过优化之后,可以提升这类应用的运算速度
数组对象采用相同的数据类型,有助于节省运算和存储空间

N维数组对象:ndarray

ndarray是一个多维数组对象,有两个部分:

实际数据
描述数据的元数据(可以将其理解为是这个数据的名称)
这里简单举个例子,比如身高有176,175,那么176和175就是实际数据,那么身高就是元数据
ndarray数组一般要求所有元素类型相同(也就是要尽量避免ndarray对象是非同质的,尽可能要保持维度,元素类型都是一样的),数组下标从0开始
ndarray在程序当中的使用
ndarray的别名是array,使用的时候要写成np.array
轴(axis):保存数据的维度
秩(rank):轴的数量

ndarray对象的属性

属性	说明
.ndim	秩，即轴的数量或维度的数量
.shape	ndarray对象的尺度，对于矩阵，n行m列
.size	ndarray对象元素的个数，相当于.shape中n*m的值
.dtype	ndarray对象的元素类型
.itemsize	ndarray对象中每个元素的大小，以字节为单位

array([[1,3,4,5,6],[7,7,9,7,12]])
a
#array([[ 1,  3,  4,  5,  6],
#       [ 7,  7,  9,  7, 12]])
a.itemsize
#4
a.shape
#(2, 5)
a.ndim
#2
a.size
#10

ndarray数组的元素类型

数据类型	说明
bool	布尔类型，True或False
intc	与c语言中的int类型一致，一般是int32或int64
intp	用于索引的整数，与c语言中ssize_t一致，int32或int64
int8	$\text字节长度的整数，取值 : [-128,127]$
int16	$\text {16位长度的整数，取值 : }[-32768,32767]$
int32	$\text { 32位长度的整数，取值 : }\left[-2^{31}, 2^{31}-1\right]$
int64	64位长度的整数，取值 : $\left[-2^{63}, 2^{63}-1\right]$
$\text { uint8 }$	$\text { 8位无符号整数，取值 : }[0,255]$
$\text { uint16 }$	$\text { 16位无符号整数，取值 : }[0,65535]$
uint32	$\text{32位无符号整数，取值：[0, 232‐1]}$
uint64	$\text{32位无符号整数，取值：[0, 264‐1]}$
float16	$\text{16位半精度浮点数：1位符号位，5位指数，10位尾数}$
float32	32位半精度浮点数：1位符号位，8位指数，23位尾数
float64	64位半精度浮点数：1位符号位，11位指数，52位尾数
complex64	复数类型，实部和虚部都是32位浮点数
complex128	复数类型，实部和虚部都是64位浮点数

复数的表示方法如下
$实部 (. re a l) + j 虚部 (. ima g)$

ndarray数组的创建方法

ndarray数组的创建方法如下
• 从Python中的列表、元组等类型创建ndarray数组
• 使用NumPy中函数创建ndarray数组，如：arange, ones, zeros等
• 从字节流（raw bytes）中创建ndarray数组
• 从文件中读取特定格式，创建ndarray数组
从Python中的列表、元组等类型创建ndarray数组

x = np.array(list/tuple) 
x = np.array(list/tuple, dtype=np.float32)

当我们使用np.array()时不指定dtype，那么NumPy将根据数据情况关联并自动生成一个一个dtype类型

a=np.array([3,4,6])#列表类型
print(a)
#[3 4 6]
b=np.array((3,6,7))#元组类型
print(b)
#[3 6 7]
c=np.array([[2,3],[9,8],[6,7]])#列表和元组
print(c)
#[[2 3]
 #[9 8]
 #[6 7]]

(2）通过NumPy中的函数创建ndarray数组，如：arange, ones, zeros等(这里大家可以和matlab的操作相联系)

函数	说明
np.arange(n)	类似range()函数，返回ndarray类型，元素从0到n‐1
np.ones(shape)	根据shape生成一个全1数组，shape是元组类型
np.zeros(shape)	根据shape生成一个全0数组，shape是元组类型
np.full(shape,val)	根据shape生成一个数组，每个元素值都是val
np.eye(n)	创建一个正方的n*n单位矩阵，对角线为1，其余为0
np.ones_like(a)	根据数组a的形状生成一个全1数组
np.zeros_like(a)	根据数组a的形状生成一个全0数组
np.full_like(a,val)	根据数组a的形状生成一个数组，每个元素值都是val

（3）使用NumPy中其他函数创建ndarray数组

函数	说明
np.linspace()	根据起止数据等间距地填充数据，形成数组
np.concatenate()	将两个或多个数组合并成一个新的数组

举一个简单的例子

d=np.eye(4)
d
#array([[1., 0., 0., 0.],
#       [0., 1., 0., 0.],
#       [0., 0., 1., 0.],
#       [0., 0., 0., 1.]])
#)
e=np.zeros((3,3))
e
#array([[0., 0., 0.],
#       [0., 0., 0.],
#       [0., 0., 0.]])

ndarray的维度变换

维度变换的操作,需要我们注意到的是,我们应当考虑哪些办法是不改变原数组的,哪些又是改变原数组的

方法	说明
.reshape(shape)	不改变数组元素，返回一个shape形状的数组，原数组不变
.resize(shape)	与.reshape()功能一致，但修改原数组
.swapaxes(ax1,ax2)	将数组n个维度中两个维度进行调换
.flatten()	对数组进行降维，返回折叠后的一维数组，原数组不变

f=np.ones((4,3),dtype=np.int32)
f
#array([[1, 1, 1],
 #      [1, 1, 1],
  #     [1, 1, 1],
  #     [1, 1, 1]])
f.reshape((3,4))
#array([[1, 1, 1, 1],
 #      [1, 1, 1, 1],
 #     [1, 1, 1, 1]])

这部分的操作可以对对内存等方面做出变化

ndarray数组的类型变换操作

new_a=a.astype(new_type)

f=np.ones((4,3),dtype=np.int32)
f
#array([[1, 1, 1],
#       [1, 1, 1],
#       [1, 1, 1],
#       [1, 1, 1]])
g=f.astype(np.float64)
g
#array([[1., 1., 1.],
#       [1., 1., 1.],
#       [1., 1., 1.],
#       [1., 1., 1.]])

即使类型相似,但是astype()方法一定会创建新的数组（原始数据的一个拷贝）
数组向列表替换的操作如下,使用到的函数是
ls=a.tolist()
以上面的数组g为例子可以得到

[[1.0, 1.0, 1.0], [1.0, 1.0, 1.0], [1.0, 1.0, 1.0], [1.0, 1.0, 1.0]]

2.ndarray 数组操作

索引:获取数组当中特定位置元素(标记位置的元素)的过程
切片:获取数组元素子集的过程
这一部分的切片操作和matlab设置步长的操作是不同的
一维数组的索引和切片操作

h=np.array([1,3,4,9,6,7,])
h[3]
#9
h[1:4]
#array([3, 4, 9])

多维数组的切片
每一个维度的切片方法与一维数组相同
每个维度可以使用步长进行跳跃切片

I=np.array([[2,3,4,7],[4,5,7,12],[2,6,7,5],[3,4,6,2]])
I
#array([[ 2,  3,  4,  7],
#       [ 4,  5,  7, 12],
#       [ 2,  6,  7,  5],
#       [ 3,  4,  6,  2]])
I[3]
#array([3, 4, 6, 2])
I[3,1]
#4

3.ndarray数组运算

数组与标量之间的运算,数组与标量之间运算作用于每一个元素
对数组每一个元素进行运算
元素级运算函数如下

函数	说明
np.abs(x) np.fabs(x)	计算数组各元素的绝对值
np.sqrt(x)	计算数组各元素的平方根
np.square(x)	计算数组各元素的平方
np.log(x) np.log10(x),np.log2(x)	计算数组各元素的自然对数、10底对数和2底对数
np.ceil(x) np.floor(x)	计算数组各元素的ceiling值或 floor值

一元函数

函数	说明
np.rint(x)	计算数组各元素的四舍五入值
np.modf(x)	将数组各元素的小数和整数部分以两个独立数组形式返回
np.cos(x) np.cosh(x),np.sin(x) np.sinh(x),np.tan(x) np.tanh(x)	计算数组各元素的普通型和双曲型三角函数
np.exp(x)	计算数组各元素的指数值
np.sign(x)	计算数组各元素的符号值，1(+), 0, ‐1(‐)

一元函数的使用实例

np.square(I)
np.square(I)

array([[  4,   9,  16,  49],
       [ 16,  25,  49, 144],
       [  4,  36,  49,  25],
       [  9,  16,  36,   4]], dtype=int32)

np.sqrt(I)

array([[1.41421356, 1.73205081, 2.        , 2.64575131],
       [2.        , 2.23606798, 2.64575131, 3.46410162],
       [1.41421356, 2.44948974, 2.64575131, 2.23606798],
       [1.73205081, 2.        , 2.44948974, 1.41421356]])

np.modf(np.sqrt(I))

(array([[0.41421356, 0.73205081, 0.        , 0.64575131],
        [0.        , 0.23606798, 0.64575131, 0.46410162],
        [0.41421356, 0.44948974, 0.64575131, 0.23606798],
        [0.73205081, 0.        , 0.44948974, 0.41421356]]),
 array([[1., 1., 2., 2.],
        [2., 2., 2., 3.],
        [1., 2., 2., 2.],
        [1., 2., 2., 1.]]))

需要的时候进行对照使用即可,并不需要进行记忆
Numpy二元函数二元运算符

函数	说明
+ ‐ * / **	两个数组各元素进行对应运算
np.maximum(x,y) np.fmax(),np.minimum(x,y) np.fmin()	元素级的最大值/最小值计算
np.mod(x,y)	元素级的模运算
np.copysign(x,y)	将数组y中各元素值的符号赋值给数组x对应元素
> < >= <= == !=	算术比较，产生布尔型数组