NumPy

最新推荐文章于 2024-09-15 22:31:42 发布

我躲过世俗的雨

最新推荐文章于 2024-09-15 22:31:42 发布

阅读量92

点赞数

分类专栏： Python 文章标签： python

本文链接：https://blog.csdn.net/qq_47255712/article/details/118295533

版权

Python 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

Numpy入门基础知识

本文主要讲解Numpy相关相关的基础知识，只针对于初学数据处理和分析的小伙伴。
在这里插入图片描述

定义

NumPy 是Python 中科学计算的基础包，他是一个Python 库，提供多维数组对象，各种派生对象（如掩码数组和矩阵），以及用于数组快速操作的各种API，有包括数字、逻辑、形状操作，排序、选择、输入输出、基本线性代数，基本统计运算和随机模拟等等。

数组类型

基本类型

NumPy 支持比Python 更多种类的数字类型，基本数字类型表示布尔值（bool），整数（int），无符号整数（uint），浮点（浮点数）和复数。

类型转换

IN:

j = np.arange(3)  
print(j)
print('查看数据类型：\n',j.dtype)
print('-'*20)
g = j.astype('float') #转换为float类型
print('查看转换后类型：\n',g.dtype)

OUT:

[0 1 2]
查看数据类型：
 int64
--------------------
查看转换后类型：
 float64

数组操作

创建数组

IN:

#方法一、将列表或元组传入np.array()来创建
print(np.array([1,2,3])) 
#方法二、初始化数组的值,只需传入元素个数即可
print(np.ones(3))
print(np.zeros(3))
print(np.random.random(3))

OUT:

[1 2 3]
[1. 1. 1.]
[0. 0. 0.]
[0.71318806 0.95903425 0.75384478]

数组运算

IN:

#首先创建两个数组
data1 = np.array([1,2])
data2 = np.ones(2)
print(data1,data2)

OUT:

[1 2] [1. 1.]

IN:

#数组间加减乘除
jia = data1+data2
jian = data1-data2
cheng = data1*data2
chu = data1/data2
#数组与单个数值的操作
shuzhi1 = data1*100
shuzhi2 = data1/100
print(jia,jian,cheng,chu,shuzhi1,shuzhi2)

OUT:

[2. 3.] [0. 1.] [1. 2.] [1. 2.] [100 200] [0.01 0.02]

数组切片

IN:

#类似列表操作进行索引和切片
data3 = np.array([1,2,3,4,5])
print(data3)
print(data3[0])
print(data3[2:4])
print(data3[2:])
print(data3[:4])

OUT:

[1 2 3 4 5]
1
[3 4]
[3 4 5]
[1 2 3 4]

聚合函数

IN:

data4 = np.array([1,2,3,4,5])
print(data4.max()) #最大值
print(data4.min()) #最小值
print(data4.mean()) #均值
print(data4.sum()) #求和
print(data4.std()) #标准差

OUT:

5
1
3.0
15
1.4142135623730951

矩阵操作

创建矩阵

IN:

#方法一、通过将二维列表传给Numpy来创建矩阵
print(np.array([[1,2],[3,4]]))
#方法二、传入一个元组来描述矩阵的维度
print(np.ones((3,2))) #3行2列矩阵
print(np.zeros((3,2))) 
print(np.random.random((3,2)))

OUT:

[[1 2]
 [3 4]]
[[1. 1.]
 [1. 1.]
 [1. 1.]]
[[0. 0.]
 [0. 0.]
 [0. 0.]]
[[0.2928769  0.24093443]
 [0.06189287 0.62359846]
 [0.80539105 0.81706549]]

矩阵运算

IN:

#相同大小矩阵的加减乘除
data5 = np.array([[1,2],[3,4]])
data6 = np.ones((2,2))
jia1 = data5 + data6
cheng1 = data5 * data6
print(jia1,'\n',cheng1)

OUT:

[[2. 3.]
 [4. 5.]] 
 [[1. 2.]
 [3. 4.]]

IN:

#不同大小矩阵的加减乘除（仅两个矩阵秩数为1时）
data7 = np.array([[1,2],[3,4],[5,6]])
data8_1 = np.ones((1,2)) #行秩为1
data8_2 = np.ones((3,1)) #列秩为1
print(data7 + data8_1)
print('-'*20)
print(data7 + data8_2)

OUT:

[[2. 3.]
 [4. 5.]
 [6. 7.]]
--------------------
[[2. 3.]
 [4. 5.]
 [6. 7.]]

IN:

#矩阵乘法，dot()方法
data9 = np.array([[1,2,3]]) #1*3的矩阵
data10 = np.array([[1,2],[3,4],[5,6]]) #3*2的矩阵
data11 = data9.dot(data10) #1*2的矩阵
print(data11)

OUT:

[[22 28]]

矩阵切片和聚合

IN:

#可以在不同维度上使用索引操作来对数据进行切片
data12 = np.array([[1,2],[3,4],[5,6]])
print(data12)
print(data12[0,1]) #1行2列数据
print(data12[1:3]) #2-3行
print(data12[0:2,0]) #1-2行，1列

OUT:

[[1 2]
 [3 4]
 [5 6]]
2
[[3 4]
 [5 6]]
[1 3]

IN:

#可以像聚合向量一样聚合矩阵
print(data12.max())
print(data12.min())
print(data12.sum())
print(data12.mean())
print(data12.std())
#还可以使用axis参数指定行和列的聚合
print(data12.max(axis = 0)) #纵向执行
print(data12.max(axis = 1)) #横向执行

OUT:

6
1
21
3.5
1.707825127659933
[5 6]
[2 4 6]

矩阵转置和重构

IN:

#NumPy数组的属性T可用于获取矩阵的转置
print('转置前：\n',data12)
print('转置后：\n',data12.T)

OUT:

转置前：
 [[1 2]
 [3 4]
 [5 6]]
转置后：
 [[1 3 5]
 [2 4 6]]

IN:

#在较为复杂的用例中，可能需要使用NumPy的reshape()方法改变某个矩阵的维度
data13 = np.array([1,2,3,4,5,6])
print('重构前：\n',data13)
print('重构后：\n',data13.reshape(2,3))
print('重构后：\n',data13.reshape(3,2))

OUT:

重构前：
 [1 2 3 4 5 6]
重构后：
 [[1 2 3]
 [4 5 6]]
重构后：
 [[1 2]
 [3 4]
 [5 6]]

IN:

#上文中的所有功能都适用于多维数据,其中心数据结构称为ndarray（N维数组）
data14 = np.array([[[1,2],[3,4]],[[5,6],[7,8]]])
print(data14)
print('-'*20)
#改变维度只需在NumPy函数的参数中添加一个逗号和维度
print(np.ones((4,3,2)))
print('-'*20)
print(np.zeros((4,3,2)))
print('-'*20)
print(np.random.random((4,3,2)))

OUT:

[[[1 2]
  [3 4]]

 [[5 6]
  [7 8]]]
--------------------
[[[1. 1.]
  [1. 1.]
  [1. 1.]]

 [[1. 1.]
  [1. 1.]
  [1. 1.]]

 [[1. 1.]
  [1. 1.]
  [1. 1.]]

 [[1. 1.]
  [1. 1.]
  [1. 1.]]]
--------------------
[[[0. 0.]
  [0. 0.]
  [0. 0.]]

 [[0. 0.]
  [0. 0.]
  [0. 0.]]

 [[0. 0.]
  [0. 0.]
  [0. 0.]]

 [[0. 0.]
  [0. 0.]
  [0. 0.]]]
--------------------
[[[0.37593802 0.42651876]
  [0.74639264 0.19783467]
  [0.787414   0.63820259]]

 [[0.84871262 0.46467497]
  [0.54633954 0.4376995 ]
  [0.71988166 0.9306682 ]]

 [[0.6384108  0.74196991]
  [0.73857164 0.38450555]
  [0.68579442 0.64018511]]

 [[0.60382775 0.35889667]
  [0.8625612  0.86523028]
  [0.83701853 0.08289658]]]

公式应用

NumPy 的关键用例是实现适用于矩阵和向量的数学公式，这也是Python中常用NumPy 的原因。

IN:

#在NumPy中可以很容易地实现均方误差。
np_1 = np.ones(3)
np_2 = np.array([1,2,3])
error = (1/3) * np.sum(np.square(np_1 - np_2))
print(error)

OUT:

1.6666666666666665

表示日常数据

电子表格和数据表

电子表格或数据表都是二维矩阵。电子表格中的每个工作表都可以是自己的变量。Python中类似的结构式pandas 数据帧（dataframe），它实际上使用NumPy 来构建的。

音频和时间序列

音频文件是一维样本数组，每个样本都是代表一段音频信号的数字。CD质量的音频每秒可能有44100个采样样本，每个样本是一个-65535到65536之间的整数，时间序列数据也是如此，例如：股票价格随时间变化的。。。

图像

图像是大小为（高度 x 宽度）的像素矩阵。如果图像是黑白图像（也称为灰度图像），则每个像素可以由单个数字表示（通常在0（黑色）和255（白色）之间）。如果，对图像处理，裁剪图像的左上角10x10大小的一块像素区域，用NumPy中的 image[:10,:10]就可以实现。

如果图像是彩色的，则每个像素由三个数字表示：红色，绿色和蓝色。在这种情况下，我们需要第三维（因为每个单元格只能包含一个数字）。因此彩色图像尺寸为（高x宽x3）的ndarray 表示。

我躲过世俗的雨

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录