通过比赛整理出的8条Numpy实用技巧【你知道如何频数统计和按某列进行排序么?】...

点击上方“潜心的Python小屋”关注我们,第一时间推送优质文章。前言大家好,我是潜心。最近被比赛折磨得不行,能不能苟进复赛,混件文化衫也两说。在此我把用到的一些Numpy方法进行下总结...
摘要由CSDN通过智能技术生成

点击上方“潜心的Python小屋”关注我们,第一时间推送优质文章。

前言

大家好,我是潜心。最近被比赛折磨得不行,能不能苟进复赛,混件文化衫也两说。在此我把用到的一些Numpy方法进行下总结。

本文约2.5k字,预计阅读15分钟。

1. 统计频数---np.bincount()

bincount()方法:计算非负整数数组中每个值出现的次数。返回一个输入数组的桶装(binning)结果。

numpy.bincount(x, weights=None, minlength=0)

参数介绍:

  • x:1维的非负整数数组;

  • weights:与x相同维度的权重数组;

  • minlength:输出数组的最小桶数(bins);当行并未出现最大的值时,就可以指定该参数;

例:

>>> np.bincount([1,2,3,4,5,1,1,1,5,4])
array([0, 4, 1, 1, 2, 2])

>>> np.bincount([1,2,3,4,5,1,1,1,5,4], weights=[0.1,0.2,0.3,0.4,0.5,0.1,0.2,0.3,0.4,0.5])
array([0. , 0.7, 0.2, 0.3, 0.9, 0.9])

>>> np.bincount([1], minlength=4)
array([0, 1, 0, 0])

2. 连接对象---np.r_[]/np.c_[]

np.r_[]/np.c_[]分别为沿行/列进行连接,这是一种快速构建数组的简单方法。数据挖掘中,最常用的就是为某个多维数组添加一行样本,或一列特征

例:

>>> np.r_[np.array([1,2,3]),  np.array([4,5,6])]
array([1, 2, 3, 4, 5, 6])

>>> np.c_[np.array([[1,2], [3,7], [8, 9]]),  np.array([4,5,6])]
array([[1, 2, 4],
       [3, 7, 5],
       [8, 9, 6]])

以上称为索引表达式。它的第一个元素放置的可选字符串可用于更改输出。字符串rc导致矩阵输出。如果结果是一维的,并且指定r,则生成一个1 x N矩阵。如果结果是一维的,并且指定了c,那么将生成一个N x 1矩阵。如果结果是二维的,那么两者都提供相同的矩阵结果。【不常用】

例:

>>> np.r_['r', np.array([1,2,3]),  np.array([4,5,6])]
matrix([[1, 2, 3, 4, 5, 6]])

>>> np.r_['c', np.array([1,2,3]),  np.array([4,5,6])]
matrix([[1],
        [2],
        [3],
        [4],
        [5],
        [6]])

它的第一个元素也可以放置字符数组。【对于将多个向量拼接为二维数组时可以使用】

  • 当为1个数字时,则是指定拼接的轴;

  • 当为2个数字时,分别指定拼接的轴以及维度的大小;【常用】

例:

>>> np.r_['0, 2', np.array([1,2,3]),  np.array([4,5,6])] # dim>=2
array([[1, 2, 3],
       [4, 5, 6]])

>>> np.r_['1, 2', np.array([1,2,3]),  np.array([4,5,6])]
array([[1, 2, 3, 4, 5, 6]])

>>> np.c_['0, 2', np.array([1,2,3]),  np.array([4,5,6])]
array([[1],
       [2],
       [3],
       [4],
       [5],
       [6]])

>>> np.c_['1, 2', np.array([1,2,3]),  np.array([4,5,6])]
array([[1, 4],
       [2, 5],
       [3, 6]])

3. 拼接函数---np.concatenate()

上述方法是一个索引表达式,numpy中也有很多拼接的函数如np.hstacknp.vstack,最常用的就是np.concatenate(),它沿现有轴连接数组序列,相比上述方法,它一次能实现多个数组拼接,但如果实现矩阵中添加向量最好使用上述方法。

numpy.concatenate((a1, a2, ...), axis=0, out=None)

参数介绍:

  • (a1, a2, …):数

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值