文章目录
Numpy
一个用于做科学计算的库
创建数组矩阵
import numpy as np
a = np.array([1,2,3])
# 指定数组类型
a = np.array([1,0,1,0], dtype=np.bool)
改
# 修改数据类型
>>> a = np.array([1,0,1,0], dtype=np.bool_)
>>> a
array([ True, False, True, False])
>>> a.astype('int8')
array([1, 0, 1, 0], dtype=int8)
# 修改小数位数
>>> a
array([[0.28235324, 0.33125425, 0.71184416, 0.26056317],
[0.62736027, 0.50191517, 0.82998521, 0.36877864]])
>>> a = np.round(a,2)
>>> a
array([[0.28, 0.33, 0.71, 0.26],
[0.63, 0.5 , 0.83, 0.37]])
# 修改数组形状
>>> a
array([0, 1, 2, 3, 4, 5, 6, 7])
>>> a.reshape(2,4)
array([[0, 1, 2, 3],
[4, 5, 6, 7]])
numpy中的数据类型
bool_ 布尔型数据类型(True 或者 False)
int_ 默认的整数类型(类似于 C 语言中的 long,int32 或 int64)
intc 与 C 的 int 类型一样,一般是 int32 或 int 64
intp 用于索引的整数类型(类似于 C 的 ssize_t,一般情况下仍然是 int32 或 int64)
int8 字节(-128 to 127)
int16 整数(-32768 to 32767)
int32 整数(-2147483648 to 2147483647)
int64 整数(-9223372036854775808 to 9223372036854775807)
uint8 无符号整数(0 to 255)
uint16 无符号整数(0 to 65535)
uint32 无符号整数(0 to 4294967295)
uint64 无符号整数(0 to 18446744073709551615)
float_ float64 类型的简写
float16 半精度浮点数,包括:1 个符号位,5 个指数位,10 个尾数位
float32 单精度浮点数,包括:1 个符号位,8 个指数位,23 个尾数位
float64 双精度浮点数,包括:1 个符号位,11 个指数位,52 个尾数位
complex_ complex128 类型的简写,即 128 位复数
complex64 复数,表示双 32 位浮点数(实数部分和虚数部分)
complex128 复数,表示双 64 位浮点数(实数部分和虚数部分)
数组与数的运算
加法
>>> a
array([[0, 1, 2, 3],
[4, 5, 6, 7]])
>>> a+1
array([[1, 2, 3, 4],
[5, 6, 7, 8]])
乘法
>>> a
array([[0, 1, 2, 3],
[4, 5, 6, 7]])
>>> a*2
array([[ 0, 2, 4, 6],
[ 8, 10, 12, 14]])
- 加法和乘法都不会对原来的数组造成改变,只会创造新的数组
- 广播的前提——两个数组必须可以转化成维度大小一模一样的才可以运算:
- 规则1:如果两个数组的维度不相同,那么小维度数组的形状将会在最左边补1.
规则2:如果两个数组的形状在任何一个维度上都不匹配,那么数组的形状会沿着维度为1扩展以匹配另外一个数组的形状。
规则3:如果两个数组的形状在任何一个维度上都不匹配并且没有任何一个维度为1,那么会引起异常。
numpy读取数据
numpy索引和切片
# 取行
>>> a
array([[ 0, 1, 2, 3],
[ 4, 5, 6, 7],
[ 8, 9, 10, 11]])
>>> a[1]
array([4, 5, 6, 7])
# 取列
>>> a[:,2]
array([ 2, 6, 10])
# 数值修改
>>> a[:,2:4]=0
>>> a
array([[0, 1, 0, 0],
[4, 5, 0, 0],
[8, 9, 0, 0]])
# bool索引
>>> a
array([[0, 1, 0, 0],
[4, 5, 0, 0],
[8, 9, 0, 0]])
>>> a[a<5]=0
>>> a
array([[0, 0, 0, 0],
[0, 5, 0, 0],
[8, 9, 0, 0]])
numpy中的三元运算符
>>> a = np.arange(24).reshape((4,6))
>>> a
array([[ 0, 1, 2, 3, 4, 5],
[ 6, 7, 8, 9, 10, 11],
[12, 13, 14, 15, 16, 17],
[18, 19, 20, 21, 22, 23]])
>>> np.where(a<10,0,10)
array([[ 0, 0, 0, 0, 0, 0],
[ 0, 0, 0, 0, 10, 10],
[10, 10, 10, 10, 10, 10],
[10, 10, 10, 10, 10, 10]])
numpy中的clip
>>> a = np.arange(24).reshape((4,6))
>>> a
array([[ 0, 1, 2, 3, 4, 5],
[ 6, 7, 8, 9, 10, 11],
[12, 13, 14, 15, 16, 17],
[18, 19, 20, 21, 22, 23]])
>>> a.clip(10,18)
array([[10, 10, 10, 10, 10, 10],
[10, 10, 10, 10, 10, 11],
[12, 13, 14, 15, 16, 17],
[18, 18, 18, 18, 18, 18]])
numpy中的nan和inf
nan: 不是一个数字
inf: 正无穷
-inf: 负无穷
>>> a=np.nan
>>> a
nan
>>> a=np.inf
>>> a
inf
两个nan不相等,nan与任何值计算都为nan
一般在数据清洗时将nan换成avg
numpy常用的统计函数
sum 计算数组中的和
mean 计算数组中的均值
var 计算数组中的方差
std 计算数组中的标准差
max 计算数组中的最大值
min 计算数组中的最小值
argmax 返回数组中最大元素的索引
argmin 返回数组中最小元素的索引
cumsum 计算数组中所有元素的累计和
cumprod 计算数组中所有元素的累计积
数组的拼接
>>> a
array([[ 0, 1, 2, 3, 4, 5],
[ 6, 7, 8, 9, 10, 11]])
>>> b
array([[12, 13, 14, 15, 16, 17],
[18, 19, 20, 21, 22, 23]])
>>> np.vstack((a,b))
array([[ 0, 1, 2, 3, 4, 5],
[ 6, 7, 8, 9, 10, 11],
[12, 13, 14, 15, 16, 17],
[18, 19, 20, 21, 22, 23]])
>>> np.hstack((a,b))
array([[ 0, 1, 2, 3, 4, 5, 12, 13, 14, 15, 16, 17],
[ 6, 7, 8, 9, 10, 11, 18, 19, 20, 21, 22, 23]])
数组的行列交换
>>> a
array([[12, 13, 14, 15],
[16, 17, 18, 19],
[20, 21, 22, 23]])
>>> a[[1,2],:] = a[[2,1],:]
>>> a
array([[12, 13, 14, 15],
[20, 21, 22, 23],
[16, 17, 18, 19]])
>>> a[:,[0,2]] = a[:,[2,0]]
>>> a
array([[14, 13, 12, 15],
[22, 21, 20, 23],
[18, 17, 16, 19]])
参考资料:
https://www.runoob.com/numpy/numpy-dtype.html
https://blog.csdn.net/qq_27825451/article/details/105657031#:~:text=Numpy%E7%9A%84%E5%B9%BF%E6%92%AD%E8%A7%84%E5%88%99%E8%A7%84%E5%88%99,1%2C%E9%82%A3%E4%B9%88%E4%BC%9A%E5%BC%95%E8%B5%B7%E5%BC%82%E5%B8%B8%E3%80%82