pandas已知数值怎么找位置_如何在Pandas系列中找到与输入数字最接近的值?

Ivo Merchier..

7

除了不能完全回答问题之外,这里讨论的其他算法的另一个缺点是它们必须对整个列表进行排序。这导致〜N log(N)的复杂性。

然而,也可以实现同样的结果〜n的。这种方法将数据帧分为两个子集,一个子集小于期望值。在较小的数据帧中,较低的邻居比最大值大,对于较高的邻居,反之亦然。

这给出了以下代码片段:

def find_neighbours(value):

exactmatch=df[df.num==value]

if !exactmatch.empty:

return exactmatch.index[0]

else:

lowerneighbour_ind = df[df.num

upperneighbour_ind = df[df.num>value].idxmin()

return lowerneighbour_ind, upperneighbour_ind

这种方法类似于在熊猫中使用分区,这在处理大型数据集时变得非常有用,而复杂性成为一个问题。

两种策略的比较表明,对于较大的N,分区策略的确更快。对于较小的N,排序策略将以更低的级别实现,因此效率更高。它也是单行代码,可能会提高代码的可读性。

复制此图的代码如下所示:

from matplotlib import pyplot as plt

import pandas

import numpy

import timeit

value=3

sizes=numpy.logspac

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值