O
(
l
o
g
n
)
O(logn)
O(logn)
统计一个数字在排序数组中出现的次数。
样例:
如样例所示,nums = [5,7,7,8,8,10]
,target = 8
,8
在数组中出现的次数为2
,于是最后返回2
。
数组有序,因此可以使用二分来做。两次二分,第一次二分查找第一个>= target
的位置begin
;第二次二分查找最后一个<= target
的位置end
,查找成功则返回end - begin + 1
,即为数字在排序数组中出现的次数,否则返回0
,表示该数没有在数组中出现。
二分模板:
模板1
当我们将区间[l, r]
划分成[l, mid]
和[mid + 1, r]
时,其更新操作是r = mid
或者l = mid + 1
,计算mid
时不需要加1
,即mid = (l + r)/2
。
C++/java代码模板:
int bsearch\_1(int l, int r)
{
while (l < r)
{
int mid = (l + r)/2;
if (check(mid)) r = mid;
else l = mid + 1;
}
return l;
}
模板2
当我们将区间[l, r]
划分成[l, mid - 1]
和[mid, r]
时,其更新操作是r = mid - 1
或者l = mid
,此时为了防止死循环,计算mid
时需要加1
,即mid = ( l + r + 1 ) /2
。
C++/java 代码模板:
int bsearch\_2(int l, int r)
{
while (l < r)
{
int mid = ( l + r + 1 ) /2;
if (check(mid)) l = mid;
else r = mid - 1;
}
return l;
}
为什么两个二分模板的mid
取值不同?
对于第二个模板,当我们更新区间时,如果左边界l
更新为l = mid
,此时mid
的取值就应为mid = (l + r + 1)/ 2
。因为当右边界r = l + 1
时,此时mid = (l + l + 1)/2
,相当于下取整,mid
为l
,左边界再次更新为l = mid = l
,相当于没有变化。while
循环就会陷入死循环。因此,我们总结出来一个小技巧,当左边界要更新为l = mid
时,我们就令 mid =(l + r + 1)/2
,相当于上取整,此时就不会因为r
取特殊值r = l + 1
而陷入死循环了。
而对于第一个模板,如果左边界l
更新为l = mid + 1
,是不会出现这样的困扰的。因此,大家可以熟记这两个二分模板,基本上可以解决99%
以上的二分问题,再也不会被二分的边界取值所困扰了。
什么时候用模板1
?什么时候用模板2
?
假设初始时我们的二分区间为[l,r]
,每次二分缩小区间时,如果左边界l
要更新为 l = mid
,此时我们就要使用模板2,让 mid = (l + r + 1)/ 2
,否则while
会陷入死循环。如果左边界l
更新为l = mid + 1
,此时我们就使用模板1,让mid = (l + r)/2
。因此,模板1和模板2本质上是根据代码来区分的,而不是应用场景。如果写完之后发现是l = mid
,那么在计算mid
时需要加上1
,否则如果写完之后发现是l = mid + 1
,那么在计算mid
时不能加1
。
为什么模板要取while( l < r)
,而不是while( l <= r)
?
本质上取l < r
和 l <= r
是没有任何区别的,只是习惯问题,如果取l <= r
,只需要修改对应的更新区间即可。
while
循环结束条件是l >= r
,但为什么二分结束时我们优先取r
而不是l
?
二分的while
循环的结束条件是l >= r
,所以在循环结束时l
有可能会大于r
,此时就可能导致越界,二分问题我们优先取r
。
二分查找的实现细节:
- 1、二分查找时,首先要确定我们要查找的边界值,保证每次二分缩小区间时,边界值始终包含在内。
- 2、注意看下面的每张图,最后的答案就是红色箭头指出的位置,也是我们二分的边界值。如果不清楚每次二分时,区间是如何更新的,可以画出和下面类似的图,每次更新区间时,要保证边值始终包含在内,这样关于左右边界的更新就会一目了然。
第一次查找target起始位置:
- 1、二分的范围,
l = 0
,r = nums.size() - 1
,我们去二分查找>= target
的最左边界begin
。 - 2、当
nums[mid] >= target
时,往左半区域找,r = mid
。
- 3、当
nums[mid] < target
时, 往右半区域找,l = mid + 1
。
- 4、如果
nums[r] != target
,说明数组中不存在目标值target
,返回0
。否则我们就找到了第一个>=target
的位置begin
。
第二次查找target结束位置:
- 1、二分的范围,
l = 0
,r = nums.size() - 1
,我们去二分查找<= target
的最右边界end
。 - 2、当
nums[mid] <= target
时,往右半区域找,l = mid
。
- 3、当
nums[mid] > target
时, 往左半区域找,r = mid - 1
。
- 4、找到了最后一个
<= target
的位置begin
,返回end - begin + 1
即可。
时间复杂度分析: 两次二分查找的时间复杂度为
O
(
l
o
g
n
)
O(logn)
O(logn)。
空间复杂度分析: 没有使用额外的数组,因此空间复杂度为
O
(
1
)
最后
🍅 硬核资料:关注即可领取PPT模板、简历模板、行业经典书籍PDF。
🍅 技术互助:技术群大佬指点迷津,你的问题可能不是问题,求资源在群里喊一声。
🍅 面试题库:由技术群里的小伙伴们共同投稿,热乎的大厂面试真题,持续更新中。
🍅 知识体系:含编程语言、算法、大数据生态圈组件(Mysql、Hive、Spark、Flink)、数据仓库、Python、前端等等。
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!