数据分析-Numpy

什么是Numpy

NumPy这个词来源于两个单词-- Numerical和Python。 NumPy是Python中的一个运算速度非常快的一个数学库,它非常重视数组,很多的数据科学的包都是依赖于Numpy的。它允许你在Python中进行向量和矩阵计算,并且由于许多底层函数实际上是用C编写的,因此你可以体验在原生Python中永远无法体验到的速度。

安装
pip install numpy
ndarray

numpy所有的操作都是围绕着数组展开的,这个数组的名字就叫做 ndarray ,在学习ndarray数组之前肯定有人会说这个东西和Python中的列表差不多啊,为什么不用列表呢,列表还要方便些。但是事实上通过ndarray不管是方便还是效率都远远地提升了。

ndarray数组创建

数组内的元素类型必须一致

数组大小不可修改

方法描述
array()将python的列表转换为数组,可选择显式指定dtype
arange()range的numpy版,支持浮点数
linspace()类似arange(),第三个参数为数组长度
zeros()根据指定形状和dtype创建全0数组
ones()根据指定形状和dtype创建全1数组
empty()根据指定形状和dtype创建空数组(随机值)
eye()根据指定边长和dtype创建单位矩阵
import numpy as np

lis = [1,2,3,4,5]
np.array(lis)
array([1, 2, 3, 4, 5])

np.arange(10)
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
np.arange(0.5,10.5,1)
array([0.5, 1.5, 2.5, 3.5, 4.5, 5.5, 6.5, 7.5, 8.5, 9.5])

#取范围内的n个数,差值相同
np.linspace(1,10,10)
array([ 1.,  2.,  3.,  4.,  5.,  6.,  7.,  8.,  9., 10.])

np.zeros((2,2))
array([[0., 0.],
       [0., 0.]])

#ones和empty和zeros类似,但是empty会优先找内存中的数据,不一定是随机的

np.eye(4,4)
array([[1., 0., 0., 0.],
       [0., 1., 0., 0.],
       [0., 0., 1., 0.],
       [0., 0., 0., 1.]])
常用属性
属性描述
T数组的转置(对高维数组而言)
dtype数组元素的数据类型
size数组元素的个数
ndim数组的维数
shape数组的维度大小(以元组形式)
itemsize每个项占用的字节数
nbytes数组中的所有数据消耗掉的字节数
数据类型

dtype

类型描述
布尔型bool_
整型int_ int8 int16 int32 int 64
无符号整型uint8 uint16 uint32 uint64
浮点型float_ float16 float32 float64
#查看数据类型
zx = np.ones((10,10))
zx.dtype
dtype('float64')

#修改数据类型
data = zx.astype(np.int16)
data.dtype
dtype('int16')

#注意
int8占1个字节,1字节(byte)占8位(bit)
 
其中最高位代表符号位 1-负号;0-正号
范围为1 1 1 1 1 1 1 1到0 1 1 1 1 1 1 1
1 0 0 0 0 0 0 为-128    0 0 0 0 0 0 0 0为0,一共256个数
范围-128-127
运算
#乘数字
z1 = [1,2,3,4,5,6]
z1 = np.array(z1)
z1 * 2
array([ 2,  4,  6,  8, 10, 12])

#乘数组,注意要一样的数组才能计算
z2 = [4,4,4,2,1,8]
z1 * z2
array([ 4,  8, 12,  8,  5, 48])

#除此之外加减乘除类似
索引切片
#维度转换
data = np.ones((10))

#转2X5的二维
zx = data.reshape(2,5)
#转一维
zx.reshape(10)

切片,索引

zx=([[ 0,  1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10, 11],
       [12, 13, 14, 15, 16, 17],
       [18, 19, 20, 21, 22, 23],
       [24, 25, 26, 27, 28, 29]])

data = np.array(zx)
#0
data[0,0]
#8,9 14,15
data[1:3,2:4]
#3x3
data[:3,:3]
#步长2
data[::2,::2]

布尔型索引-筛选数据

#筛选大于5的数据
a[a>5]
他会把每一个数据和5比较,如果满足条件就返回数据
一元函数
函数功能
abs、fabs分别是计算整数和浮点数的绝对值
sqrt计算各元素的平方根
square计算各元素的平方
exp计算各元素的指数e**x
log计算自然对数
sign计算各元素的正负号
ceil计算各元素的ceiling值
floor计算各元素floor值,即小于等于该值的最大整数
rint计算各元素的值四舍五入到最接近的整数,保留dtype
modf将数组的小数部分和整数部分以两个独立数组的形式返回,与Python的divmod方法类似
isnan判断数组中的缺失值
isinf表示那些元素是无穷的布尔型数组
cos,sin,tan普通型和双曲型三角函数
二元函数
函数功能
add将数组中对应的元素相加
subtract从第一个数组中减去第二个数组中的元素
multiply数组元素相乘
divide、floor_divide除法或向下圆整除法(舍弃余数)
power对第一个数组中的元素A,根据第二个数组中的相应元素B计算A**B
maximum,fmax计算最大值,fmax忽略NAN
miximum,fmix计算最小值,fmin忽略NAN
mod元素的求模计算(除法的余数)
数学统计
函数功能
sum求和
cumsum求前缀和
mean求平均数
std求标准差
var求方差
min求最小值
max求最大值
argmin求最小值索引
argmax求最大值索引
随机数
函数功能
rand返回给定维度的随机数组(0到1之间的数)
randn返回给定维度的随机数组
randint返回给定区间的随机整数
choice给定的一维数组中随机选择
shuffle原列表上将元素打乱(与random.shuffle相同)
uniform给定形状产生随机数组
seed设定随机种子(使相同参数生成的随机数相同)
standard_normal生成正态分布的随机样本数
参考链接

https://www.cnblogs.com/xiaoyuanqujing/articles/11647031.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值