我们假设数据大小是 n,每次查找后数据都会缩小为原来的一半,也就是会除以 2。最坏情况下,直到查找区间被缩小为空,才停止。
可以看出来,这是一个等比数列。其中 n/2k=1 时,k 的值就是总共缩小的次数。而每一次缩小操作只涉及两个数据的大小比较,所以,经过了 k 次区间缩小操作,时间复杂度就是 O(k)。通过 n/2k=1,我们可以求得 k=log2n,所以时间复杂度就是 O(logn)
。
二分查找是我们目前为止遇到的第一个时间复杂度为 O(logn) 的算法。后面章节我们还会讲堆、二叉树的操作等等,它们的时间复杂度也是 O(logn)。我这里就再深入地讲讲 O(logn) 这种对数时间复杂度。这是一种极其高效的时间复杂度,有的时候甚至比时间复杂度是常量级 O(1) 的算法还要高效。为什么这么说呢?
因为 logn 是一个非常“恐怖”的数量级,即便 n 非常非常大,对应的 logn 也很小。比如 n 等于 2 的 32 次方,这个数很大了吧?大约是 42 亿。也就是说,如果我们在 42 亿个数据中用二分查找一个数据,最多需要比较 32 次。
我们前面讲过,用大 O 标记法表示时间复杂度的时候,会省略掉常数、系数和低阶。对于常量级时间复杂度的算法来说,O(1) 有可能表示的是一个非常大的常量值,比如 O(1000)、O(10000)。所以,常量级时间复杂度的算法有时候可能还没有 O(logn) 的算法执行效率高。
1、有序数组中不存在重复元素
// 有序数组中不存在重复元素
public int binarySearch(int[] arr, int n, int value) {
int low = 0, high = n - 1;
while (low <= high) {
int mid = low + ((high - low) >> 1);
if (arr[mid] > value) {
high = mid - 1;
} else if (arr[mid] < value) {
low = mid + 1;
} else {
return mid;
}
}
return -1;
}
容易错的几个点:
- 循环退出条件
注意是 low<=high,而不是 low。
- mid 的取值
实际上,很多人写法是这个mid=(low+high)/2,这种写法是有问题的。因为如果 low 和 high 比较大的话,两者之和就有可能会溢出。改进的方法是将 mid 的计算方式写成 low+(high-low)/2。更进一步,如果要将性能优化到极致的话,我们可以将这里的除以 2 操作转化成位运算 low+((high-low)>>1)。因为相比除法运算来说,计算机处理位运算要快得多。
- low 和 high 的更新
low=mid+1,high=mid-1。注意这里的 +1 和 -1,如果直接写成 low=mid 或者 high=mid,就可能会发生死循环。比如,当 high=3,low=3 时,如果 arr[3]不等于 value,就会导致一直循环不退出。
2、二分查找的递归实现
// 二分查找的递归实现
public int binarySearchRecursive(int[] arr, int n, int value) {
return binarySearchInternally(arr, 0, n - 1, value);
}
private int binarySearchInternally(int[] arr, int low, int high, int value) {
if (low > high) return -1;
int mid = low + ((high - low) >> 1);
if (arr[mid] > value) {
binarySearchInternally(arr, low, mid - 1, value);
} else if (arr[mid] < value) {
binarySearchInternally(arr, mid - 1, high, value);
} else {
return mid;
}
return -1;
}
不知道你有没有听过这样一个说法:“十个二分九个错”。二分查找虽然原理极其简单,但是想要写出没有 Bug 的二分查找并不容易。我们接下来来看一下以下几种变形问题。
1、查找目标值区域的左边界/查找与目标值相等的第一个位置/查找第一个不小于目标值数的位置
比如下面这样一个有序数组,其中,a[5],a[6],a[7]的值都等于 20,是重复的数据。我们希望查找第一个等于 20 的数据,也就是下标是 5 的元素。
如果我们用上面讲的二分查找的代码实现,首先拿 20 与区间的中间值 arr[4]比较,20 比 19 大,于是在下标 5 到 8 之间继续查找。下标 5 和 8 的中间位置是下标 6,arr[6]正好等于 8,所以代码就返回了。
尽管 arr[6] 也等于 20,但它并不是我们想要找的第一个等于 20 的元素,因为第一个值等于 20的元素是数组下标为 5 的元素。我们上面讲的二分查找代码就无法处理这种情况了。所以,针对这个变形问题,我们可以稍微改造一下上一小节的代码。
// 查找与目标值相等的第一个位置
public int binarySearch_1(int[] arr, int n, int value) {
int low = 0, high = n - 1;
while (low <= high) {
int mid = low + ((high - low) >> 1);
if (arr[mid] > value) {
high = mid - 1;
} else if (arr[mid] < value) {
low = mid + 1;
} else {
if (mid == 0 || arr[mid - 1] != mid) {
return mid;
} else {
high = mid - 1;
}
}
}
return -1;
}
LeetCode参考:35. Search Insert Position
2、查找目标值区域的右边界/查找与目标值相等的最后一个位置/查找最后一个不大于目标值数的位置
如果你掌握了前面的写法,那这个问题你应该很轻松就能解决。
// 查找与目标值相等的最后一个位置
public int binarySearch_2(int[] arr, int n, int value) {
int low = 0, high = n - 1;
while (low <= high) {
int mid = low + ((high - low) >> 1);
if (arr[mid] > value) {
high = mid - 1;
} else if (arr[mid] < value) {
low = mid + 1;
} else {
if (mid == n - 1 || arr[mid + 1] != mid) {
return mid;
} else {
low = mid + 1;
}
}
}
return -1;
}
3、查找最后一个小于目标值的数/查找比目标值小但是最接近目标值的数
此题可有第1小题变形而来
arr [2, 3, 7, 11, 19, 20, 20, 20, 93]
target 20
return 4
// 查找最后一个小于目标值的数
public static int binarySearch_3(int[] arr, int n, int value) {
int low = 0, high = n - 1;
while (low <= high) {
int mid = low + ((high - low) >> 1);
if (arr[mid] >= value) {
high = mid - 1;
} else {
if (mid == n - 1 || arr[mid + 1] >= value) {
return mid;
} else {
low = mid + 1;
}
}
}
return -1;
}
4、查找第一个大于目标值的数/查找比目标值大但是最接近目标值的数
// 查找第一个大于目标值的数
public static int binarySearch_4(int[] arr, int n, int value) {
int low = 0, high = n - 1;
while (low <= high) {
int mid = low + ((high - low) >> 1);
if (arr[mid] > value) {
if (mid == 0 || arr[mid - 1] <= value) {
return mid;
} else {
high = mid - 1;
}
} else {
low = mid + 1;
}
}
return -1;
}
5、旋转数组返回最小元素
5.1、查找旋转数组的最小元素(假设不存在重复数字)
LeetCode参考:153. Find Minimum in Rotated Sorted Array
Input: [3,4,5,1,2]
Output: 1
// 查找旋转数组的最小元素(假设不存在重复数字)
public static int binarySearch_5(int[] arr, int n) {
int low = 0, high = n - 1;
while (low < high) {
int mid = low + ((high - low) >> 1);
if(arr[mid] > arr[high])
low = mid + 1;
else{
high = mid;
}
}
return arr[low];
}
意这里和之前的二分查找的几点区别:
-
循环判定条件为low < high,没有等于号。
-
循环中,通过比较arr[low]与arr[mid]的值来判断mid所在的位置。
-
如果arr[mid] > arr[high],说明前半部分是有序的,最小值在后半部分,令low = mid + 1。
-
如果arr[mid] <= arr[high],说明最小值在前半部分,令high = mid。
最后,left会指向最小值元素所在的位置。
5.2、查找旋转数组的最小元素(存在重复项)
LeetCode参考:154. Find Minimum in Rotated Sorted Array II
Input: [2,2,2,0,1]
Output: 0
// 查找旋转数组的最小元素(存在重复项)
public static int binarySearch_6(int[] arr, int n) {
int low = 0, high = n - 1;
while (low < high) {
int mid = low + ((high - low) >> 1);
if (arr[mid] > arr[high]) {
low = mid + 1;
} else if (arr[mid] < arr[high]) {
high = mid;
} else {
high–;
}
}
return arr[low];
}
和之前不存在重复项的差别是:当arr[mid] == arr[high]时,我们不能确定最小值在 mid的左边还是右边,所以我们就让右边界减一。
6、在旋转排序数组中搜索
6.1、不考虑重复项
自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。
深知大多数Java工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年Java开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Java开发知识点,真正体系化!
由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且会持续更新!
如果你觉得这些内容对你有帮助,可以扫码获取!!(备注Java获取)
总结
如果你选择了IT行业并坚定的走下去,这个方向肯定是没有一丝问题的,这是个高薪行业,但是高薪是凭自己的努力学习获取来的,这次我把P8大佬用过的一些学习笔记(pdf)都整理在本文中了
《Java中高级核心知识全面解析》
小米商场项目实战,别再担心面试没有实战项目:
《互联网大厂面试真题解析、进阶开发核心学习笔记、全套讲解视频、实战项目源码讲义》点击传送门即可获取!
实战项目、讲解视频,并且会持续更新!**
如果你觉得这些内容对你有帮助,可以扫码获取!!(备注Java获取)
总结
如果你选择了IT行业并坚定的走下去,这个方向肯定是没有一丝问题的,这是个高薪行业,但是高薪是凭自己的努力学习获取来的,这次我把P8大佬用过的一些学习笔记(pdf)都整理在本文中了
《Java中高级核心知识全面解析》
[外链图片转存中…(img-NsnVYt6X-1713713450718)]
小米商场项目实战,别再担心面试没有实战项目:
[外链图片转存中…(img-NsaPt9sV-1713713450718)]
《互联网大厂面试真题解析、进阶开发核心学习笔记、全套讲解视频、实战项目源码讲义》点击传送门即可获取!