前言
以前写了好多次的二分查找了,但对于一些细节感觉还是没有领悟道,比如while循环里面是否加上等号,mid是否要加一等等,每次写的时候虽然都过了,但总感觉是稀里糊涂的过的,这次特意来深度理解下二分,解决自己所有困惑的地方。(不断更新)
一、基本框架(数组查找某个数位置)
核心代码:
int l = 0, r = len - 1, ans;
while(l <= r) {
int mid = l + r >> 1;
if(a[mid] == k){
ans = mid;
break;
}
else if(a[mid] < k)
l = mid + 1;
else
r = mid - 1;
}
看到这个代码都比较熟悉,但有几个关键点:
1. 为什么是 L <= R,而不是 L < R ?这里加上等号的关键是R的初始化的值为 len - 1,它表示的查找区间是[0, len - 1],两边都是闭区间,如果 L < R 的话,比如 [1, 1] 这个区间不会算到,答案可能会错误。
2. 为什么两个都是 mid - 1 或者 mid + 1呢 ?这个也很好理解,如果在 [L, R] 这个闭区间 mid 没找到,当然是从 [L, mid - 1] 和 [mid + 1, R] 这两个区间找了。
二、灵活运用(数组查找第一个 >= k 的位置)
1. 由上面我们知道了二分查找的代码主要是看查找区间,即左右区间是否是闭开,然后我们就可以灵活应用它来解决实际问题,如数组查找第一个 >= k 的位置。
代码如下:
int l = 0, r = len;
while(l <= r) {
int mid = l + r >> 1;
if(ans[mid] >= k)
r = mid - 1;
else
l = mid + 1;
}
注意看上面代码,是在 [0, len] 这个闭区间查找的,我们将 >= 合在一起,意思是如果这个位置的数大于等于k,就往[L, mid - 1]这个区间查找,即区间往左缩,很显然退出循环的时候,R 的值就是恰好小于k的位置,而循环退出条件是 L == R + 1,所以此时 L 就是第一个 >= k 的位置,这种用法在很多题型会用到。
2. 当然了,也可以用 L < R 的形式,即左边闭区间,右边开区间,[0,len)
代码如下:
int l = 0, r = len;
while(l < r) {
int mid = l + r >> 1;
if(ans[mid] >= k)
r = mid;
else
l = mid + 1;
}
这里注意看,r 的值变成了 mid,原因也很显然,在[L,R)区间中,往左缩区间就是[L,mid),然后循环终止条件是 L == R,所以此时的 L也正好是第一个 >= k 的位置。
3. 当然还有一种更简便的方法,直接用标准库函数,上面代码直接用一行代替:
lower_bound(beg, end, val); //返回一个迭代器,表示第一个大于或等于val的元素,不存在返回end
//要返回它的位置的话这样用
int p = lower_bound(beg, end, val) - beg;
当然,如果要找第一个大于 val 的元素的位置的话,用下列代码:
upper_bound(beg, end, val); //返回一个迭代器,表示第一个大于val的元素,不存在返回end
//要返回它的位置的话这样用
int p = upper_bound(beg, end, val) - beg;
如果要找第一个小于或等于,小于 val 的元素,加个 great 就行了
lower_bound(beg, end, val, greater<type>()); //返回一个迭代器,表示第一个小于或等于val的元素,不存在返回end
upper_bound(beg, end, val, greater<type>()); //返回一个迭代器,表示第一个小于val的元素,不存在返回end
总结:
- 二分查找注意查找区间是否开闭,以此确定 L,R的值
- 注意看循环退出条件(L ? R) ,以此进行后面的运算
- lower_bound()
大于或等于
- upper_bound()
大于
三、例题
牛客:NC25148