点击上方“潜心的Python小屋”关注我们,第一时间推送优质文章。
前言
大家好,我是潜心。最近被比赛折磨得不行,能不能苟进复赛,混件文化衫也两说。在此我把用到的一些Numpy方法进行下总结。
本文约2.5k字,预计阅读15分钟。
1. 统计频数---np.bincount()
bincount()
方法:计算非负整数数组中每个值出现的次数。返回一个输入数组的桶装(binning)结果。
numpy.bincount(x, weights=None, minlength=0)
参数介绍:
x:1维的非负整数数组;
weights:与x相同维度的权重数组;
minlength:输出数组的最小桶数(bins);当行并未出现最大的值时,就可以指定该参数;
例:
>>> np.bincount([1,2,3,4,5,1,1,1,5,4])
array([0, 4, 1, 1, 2, 2])
>>> np.bincount([1,2,3,4,5,1,1,1,5,4], weights=[0.1,0.2,0.3,0.4,0.5,0.1,0.2,0.3,0.4,0.5])
array([0. , 0.7, 0.2, 0.3, 0.9, 0.9])
>>> np.bincount([1], minlength=4)
array([0, 1, 0, 0])
2. 连接对象---np.r_[]/np.c_[]
np.r_[]
/np.c_[]
分别为沿行/列进行连接,这是一种快速构建数组的简单方法。数据挖掘中,最常用的就是为某个多维数组添加一行样本,或一列特征。
例:
>>> np.r_[np.array([1,2,3]), np.array([4,5,6])]
array([1, 2, 3, 4, 5, 6])
>>> np.c_[np.array([[1,2], [3,7], [8, 9]]), np.array([4,5,6])]
array([[1, 2, 4],
[3, 7, 5],
[8, 9, 6]])
以上称为索引表达式
。它的第一个元素放置的可选字符串可用于更改输出。字符串r
或c
导致矩阵输出。如果结果是一维的,并且指定r
,则生成一个1 x N
矩阵。如果结果是一维的,并且指定了c
,那么将生成一个N x 1
矩阵。如果结果是二维的,那么两者都提供相同的矩阵结果。【不常用】
例:
>>> np.r_['r', np.array([1,2,3]), np.array([4,5,6])]
matrix([[1, 2, 3, 4, 5, 6]])
>>> np.r_['c', np.array([1,2,3]), np.array([4,5,6])]
matrix([[1],
[2],
[3],
[4],
[5],
[6]])
它的第一个元素也可以放置字符数组。【对于将多个向量拼接为二维数组时可以使用】
当为1个数字时,则是指定拼接的轴;
当为2个数字时,分别指定拼接的轴以及维度的大小;【常用】
例:
>>> np.r_['0, 2', np.array([1,2,3]), np.array([4,5,6])] # dim>=2
array([[1, 2, 3],
[4, 5, 6]])
>>> np.r_['1, 2', np.array([1,2,3]), np.array([4,5,6])]
array([[1, 2, 3, 4, 5, 6]])
>>> np.c_['0, 2', np.array([1,2,3]), np.array([4,5,6])]
array([[1],
[2],
[3],
[4],
[5],
[6]])
>>> np.c_['1, 2', np.array([1,2,3]), np.array([4,5,6])]
array([[1, 4],
[2, 5],
[3, 6]])
3. 拼接函数---np.concatenate()
上述方法是一个索引表达式,numpy中也有很多拼接的函数如np.hstack
、np.vstack
,最常用的就是np.concatenate()
,它沿现有轴连接数组序列,相比上述方法,它一次能实现多个数组拼接,但如果实现矩阵中添加向量最好使用上述方法。
numpy.concatenate((a1, a2, ...), axis=0, out=None)
参数介绍:
(a1, a2, …):数