numpy模块是科学计算包,提供了Python中没有的数组对象,支持N维数组运算、处理大型矩阵、成熟的广播函数库等功能
1.导入numpy库
import numpy as np
2.创建数组
t1 = np.array([1,2,3,4,5])
相当于
t2 = np.array(range(1,6))
相当于
t3 = np.arange(1,6)
查看效果
print(t1)
print('*'*15)
print(t2)
print('*'*15)
print(t3)
3.选择一行或多行数据(列)
t4 = np.arange(12).reshape(3, 4).astype('float')
print(t4)
#数组第二行的数据(下标从0开始)
print(t4[1])
print('*'*15)
#数组第一列的数据(下标从0开始)
print(t4[:, 0])
效果展示
4.查看数据形状与修改形状以及数据类型
a = np.array([[1,2,3,4,5],[6,7,8,9,10]])
a.shape | 查看数组a的形状 |
---|---|
a.reshape(x,y) | 修改数组a的形状为x行y列 |
a.dtype | 查看数组a的数据类型 |
a.astype(‘float’) | 修改数组类型为浮点型 |
5.numpy读取csv文本
csv文本:逗号分隔值文件
使用numpy中的loadtxt函数
np.loadtxt(fname,dtype=np.float,delimiter=None,skiprows=0,usecols=None,unpack=False)
参数 | 解释 |
---|---|
fname | 文件、字符串或产生器 |
dtype | 数据类型,可选,默认np.float |
delimiter | 分隔字符串,默认是任何空格 |
skiprows | 跳过前x行,一般跳过第一行表头 |
usecols | 读取指定的列,索引,元组类型 |
unpack | 如果是True,读入属性将分别写入不同数组变量,False读入数据只写入一个数组变量,默认False |
6.布尔索引及其应用
替换元组a = array([[12,2,3,24],[2,13,4,15]])中大于10的值替换成10
In[1]:a = array([[12,2,3,24],[2,13,4,15]])
a[a>10]=10
print(a)
Out[1]:[[10,2,3,10]
[2,10,4,10]]
7.np.where(三元运算符)和np.clip(裁剪)
import numpy as np
t5 = np.array([[1,2,3,4],[54,4,7,8]])
#元组t5中小于5的换为1,其他换为0
t5 = np.where(t5<5,1,0)
print(t5)
效果展示