微信公众号:珷玞的日常
基础
二分查找针对的是一个有序的数据集合。每次都与区间中间的数据比较大小,将待查找的范围缩小到原来的一半,直到找到要查找的元素,或者区间被缩小为 0。
时间复杂度 O(nlogn)。
二分查找的递归和非递归实现
# 循环实现 def binarySearch(l,data): n = len(l) low = 0 high = n - 1 while(low <= high): # mid = (low + high)//2 mid = low + (high - low )//2 if l[mid] == data: return mid if l[mid] < data: low = mid + 1 if l[mid] > data: high = mid - 1 return -1 # 递归实现 def binarySearch2(l,data): n = len(l) return binarySearch21(l,data,0,n-1) def binarySearch21(l,data,low,high): if(low > high): return -1 mid = low + (high - low) // 2 if l[mid] == data: return mid if l[mid] > data: return binarySearch21(l,data,0,mid-1) if l[mid] < data: return binarySearch21(l,data,mid+1,len(l)-1)
二分查找局限性
-
二分查找依赖的是顺序表结构,简单说就是数组。
由于二分查找需要按照元素下标来访问,如果是链表这种结构,随机访问时间复杂度是在太高,使用二分查找就会很慢。
-
二分查找针对有序数据
如果数据无序,那么必须先进行排序。如果数据有频繁的插入删除操作,那么必须保证插入删除操作之后,数据仍然是有序的。对于这种情况,对数据的维护成本比较高,使用起来就不是那么方便。
-
数据量太小或者太大不适合二分查找
如果数据量很小,顺序遍历和二分查找时间差距不是很大;数据量太大,由于二分查找依赖数组这种数据结构,对内存的要求比较严苛。
二分查找的几种变形
查找第一个值等于给定值的元素
代码如下:
def binarySfirst(l,data): n = len(l) low = 0 high = n-1 while(low <= high): mid = low + (high - low)//2 if l[mid] > data: high = mid-1 if l[mid] < data: low = mid + 1 # 主要是处理相等的时候,这个是不是第一个 if l[mid] == data: if mid == 0 or l[mid-1] != data: return mid else: high = mid-1
在这种情况下,其实主要是特殊处理当 l[mid] 和 data 相等的时候,检查是不是第一个的问题,从 13 行开始,我们添加一部分代码执行这个功能。
检查的条件也很简单:
-
mid == 0
-
l[mid-1] != data
如不满足这两个条件,那么在这个元素之前一定有一个和它值相同的元素,我们再次将范围定到 [0,mid-1] 中重新寻找。
查找最后一个等于给定值的位置
这和前边的很相似,就是检查条件稍微变动一下,其他的没什么。代码如下:
def binarySlast(l,data): n = len(l) low = 0 high = n-1 while(low <= high): mid = low + (high - low)//2 if l[mid] > data: high = mid-1 if l[mid] < data: low = mid + 1 if l[mid] == data: if mid == 0 or l[mid+1] != data: return mid else: low = mid + 1