计算机中二分查找应用,深入理解二分查找

文章目录

何为二分查找法

二分查找法的使用

C++中的二分查找法

左闭右开原则

lower_bound返回值说明

upper_bound返回值说明

使用Python实现lower_bound()

丑陋实现

优化实现

结尾

何为二分查找法

以下来自Wiki

在计算机科学中,二分搜索(英语:binary search),也称折半搜索(英语:half-interval search、对数搜索(英语:logarithmic search,是一种在有序数组中查找某一特定元素的搜索算法。搜索过程从数组的中间元素开始,如果中间元素正好是要查找的元素,则搜索过程结束;如果某一特定元素大于或者小于中间元素,则在数组大于或小于中间元素的那一半中查找,而且跟开始一样从中间元素开始比较。如果在某一步骤数组为空,则代表找不到。这种搜索算法每一次比较都使搜索范围缩小一半。

二分查找法的使用

计算机世界里,快速查找是一个非常重要的话题,二分查找作为基础且重要的查找方法,值得深入学习。

使用二分查找的要点:

时间复杂度:O ( l o g   n ) O(log~n)O(logn),原因在于每次把搜索区域减少一半

空间复杂度:O ( 1 ) O(1)O(1)

使用条件:有序数组

C++中的二分查找法

头文件: #include

主要使用的两个函数:

lower_bound(first, last, key)

upper_bound(first, last, key)

要说明的是,在有关数组界限中,一般使用左闭右开的原则,即(,]

左闭右开原则

大多数有关界限的问题,计算机世界中大多会使用左闭右开的原则,其原因归结于下:

上下界之差为元素个数

易于表现两个相邻区间,前一区间的下界,即为后一区间的上界

易于表达空集,上界不会大于下界

lower_bound返回值说明

74411fcf240b8472ee46ecc29bd38729.png

lower_bound返回值ret与key的关系:

r e t ≥ k e y ret \ge keyret≥key

upper_bound返回值说明

782f7d299e08c27094f18e229935c76c.png

lower_bound返回值ret与key的关系:

r e t > k e y ret \gt keyret>key

使用Python实现lower_bound()

丑陋实现

def lower_bound(sublist, key):

"""

二分查找

:param sublist: 有序序列

:param key: 需要查找的值

:return: >= key

"""

l, r = 0, len(sublist)

while l < r: # 根据左闭右开原则, l < r 表示还有区域可搜索

# m = (l + r) // 2 存在溢出可能

m = l + (r - l) // 2

# 若搜索区域为偶数,则m中间靠右,即偏大

# 若搜索区域为奇数,则m中间

if sublist[m] > key:

# key在sublist[m]的左侧

r = m

elif sublist[m] < key:

# key 在sublist[m]的右侧

l = m + 1 # 左闭右开区间, m索引已经考虑,不符合,即不在搜索区域内

else:

# 相等下,遍历左侧搜索区域,该步骤可能会提高时间复杂度

for i in range(m - 1, l - 1, -1):

if sublist[i] != key:

return i + 1

# 出循环条件 l == r, 意味没有找到

if l < len(sublist) and sublist[l] < key:

l += 1

return l

优化实现

以上的实现,是最直观的实现方法,但非常冗长.

关键点:

如果key在数组中大量重复,会严重降低算法复杂度

最后返回值处理并不优雅,没有充分考虑到各种每次所选择的中间值(偶数情况)带来的问题

关键点1的解决:

应该依旧使用二分查找在剩下的区域中查找,从而避免算法退化

关键点2的解决:

考虑一种情况,key值不在数组中.

如果进行二分搜索,搜索范围应该是:

…->4->2->1

考虑4个元素情况下的一些情形(未列举完全):

如图所示,黄色为本次循环的middle值,即所考察的值。

而红色为key本该在的位置,箭头为最终指向的返回值。

65417cd87f5d96d374d461f2be10cbb7.png

通过图发现,每次返回的值与key的大小关系不固定。

而最终返回值期望是大于或等于key的值。

原因在于:如果为偶数元素个数情况下,small,(middle), big,在这次循环中,会选择big,从而导致大值被排除,剩下较小值,不满足返回条件

综上,代码修改如下:

def lower_bound(sublist, key):

"""

二分查找

:param sublist: 有序序列

:param key: 需要查找的值

:return: >= key

"""

l, r = 0, len(sublist)

while l < r:

m = l + (r - l - 1) // 2 # 选择靠左的值

if sublist[m] >= key:

# 在等于的情况下,考虑重复元素,要依旧在左侧寻找key,因此设置右界限为m

r = m

else:

l = m + 1

return r

结尾

曾经以为二分查找算法非常简单,但通过深入学习优秀的源码,以及自己动手,才发现并没有想象中的那么简单,想要写出优雅的算法代码,确实是需要多思考多动手的。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值