Numpy & Pandas

最新推荐文章于 2022-11-26 19:19:10 发布

komorebi6

最新推荐文章于 2022-11-26 19:19:10 发布

阅读量309

点赞数 1

文章标签： python numpy

本文链接：https://blog.csdn.net/komorebi6/article/details/104000023

版权

添加链接描述

Numpy

numpy属性
Numpy 的创建 array
Numpy 基础运算1
Numpy 基础运算2
Numpy 索引
Numpy array 合并
Numpy array 分割
Numpy copy & deep copy

Pandas

Pandas 基本介绍

一.numpy属性

ndim：维度
shape：行数和列数
size：元素个数
使用numpy首先要导入模块

import numpy as np #为了方便使用numpy 采用np简写

列表转化为矩阵：

array = np.array([[1,2,3],[2,3,4]])  #列表转化为矩阵
print(array)
"""
array([[1, 2, 3],
       [2, 3, 4]])
"""

numpy 的几种属性

print('number of dim:',array.ndim)  # 维度
# number of dim: 2

print('shape :',array.shape)    # 行数和列数
# shape : (2, 3)

print('size:',array.size)   # 元素个数
# size: 6

二.创建 array

关键字
array：创建数组
dtype：指定数据类型
zeros：创建数据全为0
ones：创建数据全为1
empty：创建数据接近0
arrange：按指定范围创建数据
linspace：创建线段

1.创建数组

a = np.array([2,23,4])  # list 1d
print(a)
# [2 23 4]

2.指定数据 dtype

a = np.array([2,23,4],dtype=np.int)
print(a.dtype)
# int 32

a = np.array([2,23,4],dtype=np.int32)
print(a.dtype)
# int32

a = np.array([2,23,4],dtype=np.float)
print(a.dtype)
# float64

a = np.array([2,23,4],dtype=np.float32)
print(a.dtype)
# float32

3.创建特定数据

a = np.array([[2,23,4],[2,32,4]])  # 2d 矩阵 2行3列
print(a)
"""
[[ 2 23  4]
 [ 2 32  4]]

创建全零数组

a = np.zeros((3,4)) # 数据全为0，3行4列
"""
array([[ 0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.]])
"""

创建全一数组, 同时也能指定这些特定数据的 dtype:

a = np.ones((3,4),dtype = np.int)   # 数据为1，3行4列
"""
array([[1, 1, 1, 1],
       [1, 1, 1, 1],
       [1, 1, 1, 1]])
"""

创建全空数组, 其实每个值都是接近于零的数:

a = np.empty((3,4)) # 数据为empty，3行4列
"""
array([[  0.00000000e+000,   4.94065646e-324,   9.88131292e-324,
          1.48219694e-323],
       [  1.97626258e-323,   2.47032823e-323,   2.96439388e-323,
          3.45845952e-323],
       [  3.95252517e-323,   4.44659081e-323,   4.94065646e-323,
          5.43472210e-323]])
"""

用 arange 创建连续数组:

a = np.arange(10,20,2) # 10-19 的数据，2步长
"""
array([10, 12, 14, 16, 18])
"""

使用 reshape 改变数据的形状

a = np.arange(12).reshape((3,4))    # 3行4列，0到11
"""
array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])
"""

用 linspace 创建线段型数据:

a = np.linspace(1,10,5)#从1到10生成五段的数列
print(a)
....
[ 1.    3.25  5.5   7.75 10.  ]

同样也能进行 reshape 工作:

a = np.linspace(1,10,6).reshape((2,3))
....
[[ 1.   2.8  4.6]
 [ 6.4  8.2 10. ]]

三.Numpy 基础运算1

从一个脚本开始了解相应的计算以及表示形式 :

import numpy as np
a=np.array([10,20,30,40])   # array([10, 20, 30, 40])
b=np.arange(4)              # array([0, 1, 2, 3])

上述代码中的 a 和 b 是两个属性为 array 也就是矩阵的变量，而且二者都是1行4列的矩阵，其中b矩阵中的元素分别是从0到3。
numpy 的几种基本运算:
1.两个矩阵之间的减法

c=a-b  # array([10, 19, 28, 37])

2.相加

c=a+b   # array([10, 21, 32, 43])

3.相乘

c=a*b   # array([  0,  20,  60, 120])

**4.求出矩阵中各个元素的乘方需要依赖双星符号 ，以二次方举例

c=b**2  # array([0, 1, 4, 9])

5.数学函数工具，比如三角函数等
当我们需要对矩阵中每一项元素进行函数运算时，可以很简便的调用它们（以sin函数为例）：

c=10*np.sin(a)  
# array([-5.44021111,  9.12945251, -9.88031624,  7.4511316 ])

6.在脚本中对print函数进行一些修改可以进行逻辑判断

print(b<3)  
# array([ True,  True,  True, False], dtype=bool)

此时由于进行逻辑判断，返回的是一个bool类型的矩阵，即对满足要求的返回True，不满足的返回False。上述程序执行后得到的结果是[True True True False]。需要注意的是，如果想要执行是否相等的判断，依然需要输入 == 而不是 = 来完成相应的逻辑判断。

7.多行多维度的矩阵进行操作

上述运算均是建立在一维矩阵，即只有一行的矩阵上面的计算，如果我们想要对多行多维度的矩阵进行操作，需要对开始的脚本进行一些修改：

a=np.array([[1,1],[0,1]])
b=np.arange(4).reshape((2,2))

print(a)
# array([[1, 1],
#       [0, 1]])

print(b)
# array([[0, 1],
#       [2, 3]])

此时构造出来的矩阵a和b便是2行2列的，其中 reshape 操作是对矩阵的形状进行重构，其重构的形状便是括号中给出的数字。
稍显不同的是，Numpy中的矩阵乘法分为两种，其一是前文中的对应元素相乘，其二是标准的矩阵乘法运算，即对应行乘对应列得到相应元素：

#标准矩阵乘法
c_dot = np.dot(a,b)
# array([[2, 4],
#       [2, 3]])

除此之外还有另外的一种关于dot的表示方法:

c_dot_2 = a.dot(b)
# array([[2, 4],
#       [2, 3]])

8. sum(), min(), max()
重新定义一个脚本

import numpy as np
a=np.random.random((2,4))#random随机生成一个2行4列的矩阵
print(a)
# array([[ 0.94692159,  0.20821798,  0.35339414,  0.2805278 ],
#       [ 0.04836775,  0.04023552,  0.44091941,  0.21665268]])

因为是随机生成数字, 所以你的结果可能会不一样.
在第二行中对a的操作是令a中生成一个2行4列的矩阵，且每一元素均是来自从0到1的随机数。
在这个随机生成的矩阵中，我们可以对元素进行求和以及寻找极值的操作，具体如下：

np.sum(a)   # 4.4043622002745959
np.min(a)   # 0.23651223533671784
np.max(a)   # 0.90438450240606416

9.对行或者列进行查找运算
就需要在上述代码中为 axis 进行赋值。
当axis的值为0的时候，将会以列作为查找单元，
当axis的值为1的时候，将会以行作为查找单元

print("a =",a)
# a = [[ 0.23651224  0.41900661  0.84869417  0.46456022]
# [ 0.60771087  0.9043845   0.36603285  0.55746074]]

print("sum =",np.sum(a,axis=1))
# sum = [ 1.96877324  2.43558896]

print("min =",np.min(a,axis=0))
# min = [ 0.23651224  0.41900661  0.36603285  0.46456022]

print("max =",np.max(a,axis=1))
# max = [ 0.84869417  0.9043845 ]

四.Numpy 基础运算2

对应元素的索引也是非常重要的。依然，让我们先从一个脚本开始
1.argmin() 和 argmax()

import numpy as np
A = np.arange(2,14).reshape((3,4)) 

# array([[ 2, 3, 4, 5]
#        [ 6, 7, 8, 9]
#        [10,11,12,13]])
         
print(np.argmin(A))    # 0最小值（2）的位置的索引
print(np.argmax(A))    # 11

argmin() 和 argmax() 两个函数分别对应着求矩阵中最小元素和最大元素的索引。相应的，在矩阵的12个元素中，最小值即2，对应索引0，最大值为13，对应索引为11。
2.均值

print(np.mean(A))        # 7.5
print(np.average(A))     # 7.5

仿照着前一节中dot() 的使用法则，mean()函数还有另外一种写法：

print(A.mean())          # 7.5

3.中位数

print(np.median(A))      # 7.5

4.累加累差

print(np.cumsum(A)) 

# [2 5 9 14 20 27 35 44 54 65 77 90]

在cumsum()函数中：生成的每一项矩阵元素均是从原矩阵首项累加到对应项的元素之和。比如元素9，在cumsum()生成的矩阵中序号为3，即原矩阵中2，3，4三个元素的和。

print(np.diff(A))    

# [[1 1 1]	2，3的差 3，4的差 4，5的差
#  [1 1 1]
#  [1 1 1]]

该函数计算的便是每一行中后一项与前一项之差。故一个3行4列矩阵通过函数计算得到的矩阵便是3行3列的矩阵。
5.nonzero()函数

print(np.nonzero(A))    

# (array([0,0,0,0,1,1,1,1,2,2,2,2]),array([0,1,2,3,0,1,2,3,0,1,2,3]))
#输出值的行数				输出值的列数

这个函数将所有非零元素的行与列坐标分割开，重构成两个分别关于行和列的矩阵。
6.排序
对所有元素进行仿照列表一样的排序操作，但这里的排序函数仍然仅针对每一行进行从小到大排序操作：

import numpy as np
A = np.arange(14,2, -1).reshape((3,4)) 

# array([[14, 13, 12, 11],
#       [10,  9,  8,  7],
#       [ 6,  5,  4,  3]])

print(np.sort(A))    #逐行排序

# array([[11,12,13,14]
#        [ 7, 8, 9,10]
#        [ 3, 4, 5, 6]])

7.矩阵的转置有两种表示方法：

print(np.transpose(A))    
print(A.T)

# array([[14,10, 6]
#        [13, 9, 5]
#        [12, 8, 4]
#        [11, 7, 3]])
# array([[14,10, 6]
#        [13, 9, 5]
#        [12, 8, 4]
#        [11, 7, 3]])

8.clip()函数

print(A)
# array([[14,13,12,11]
#        [10, 9, 8, 7]
#        [ 6, 5, 4, 3]])

print(np.clip(A,5,9))    #所有小于5的数等于5 所有大于9的数等于9 之间的数保留原型
# array([[ 9, 9, 9, 9]
#        [ 9, 9, 8, 7]
#        [ 6, 5, 5, 5]])

9.注意
所有的numpy指令都可以指定按行还是按列计算

A = np.arange(2,14).reshape((3,4))
print(A)
print(np.mean(A,axis=1))#按行计算平均数
....
[[ 2  3  4  5]
 [ 6  7  8  9]
 [10 11 12 13]]
[ 3.5  7.5 11.5]

komorebi6

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫