简介
二分查找,也被称作折半查找,能够极大优化算法的时间复杂度,二分查找的时间复杂度为log2^N(2为底,N为数据长度),其算法的主要思想就是:在一个有序的内容里面,每次取现有区间的中间那个值,和要查找的值进行比较,根据这两个值的大小对现有区间的左右端点重新设置,再次查找,直到找到目标或者区间不存在。
在这里两个点显得尤为重要,也是使用二分查找的必要条件:
1、用于查找的内容从逻辑上讲是有序的。
2、目标值的数量只能是一个,不可以是多个。
关于二分查找的时间复杂度
二分查找的时间按复杂度是log2^N(2为底)的原因是(参考下图,黑色的为辅助理解还原折半过程的线),假设在长度为N(有N块空间)的内容里面查找a,现在已经找到a,逆向还原该查找过程,就是原本是一块a区间,第n次查找之前,是2块,第n-1次查找之前是4块,第n-2次查找之前是8块……
可以写成:
1*2*2*2*2*2……=N (假设查找了n次,即要还原n次)1*2^n=N
n=log2^N(2为底)
所以查找次数为log2^N,时间复杂度就是它。
二分查找算法
代码如下,(详细图解在代码下方),在1-8中查找5,输出对应下标。
首先设置三个变量left,right,mid,分别表示最左边元素下标,最右边元素下标,和中间元素下标,因为并不知道要查找多少次,所以用while循环来写,循环控制条件是left<=right,因为如果left>right,那么就相当于一个区间的左端点大于右端点,不符合要求。
进入while循环首先要重置mid的值,然后判断arr[mid]和目标值的大小关系,如果arr[mid]的值大于目标值,那么说明,目标值在下标为[left,mid-1](这是一个区间,便于理解,这里只取整数)之间,所以right要重置成mid-1;同样,arr[mid]的值小于目标值也类似;除了这两种情况就是等于了,输出mid就行。(因为每次没找到的循环结束前都要重置left或者right的值,但是mid值没有重置,所以把它放到下一次循环最开始取重置。)
#include<stdio.h>
int main()
{
int arr[8] = { 1,2,3,4,5,6,7,8 };
int left = 0, right = sizeof(arr) / sizeof(arr[0]) - 1;
//left和right分别表示该数据最左边和最右边的下标
int mid = 0,target=5;
while (left <= right)
{
mid = (left + right) / 2;
if (arr[mid] > target)
right = mid - 1;//重置右端点
if (arr[mid] < target)
left = mid + 1;//重置左端点
else
{
printf("找到了,下标是:%d", mid);
break;
}
}
if (left > right)//没找到的情况
printf("没有找到!");
return 0;
}
但,值得注意的是,当没有找到的时候,left或者right并不是在每个二分查找算法里面都是重置为left=mid+1; right=mid-1; 要根据不同的情况来判断,不是一成不变的,比如下面这题:
旋转数组的最小数字_牛客题霸_牛客网 (nowcoder.com)
这道题并不是要精准查找某一个值,而是要找最小数字,比如遇到这种情况:
[4,5,6,1,2,3,3] arr[low]=4,arr[mid]=1,arr[high]=3,如果这个时候high=mid-1,就变成了[4,5,6]这种情况,1就直接被跳过了,明显是没有考虑到位,并且还有另外一个坑,如下的(3)。
需要考虑三种情况:
(1)array[mid] > array[high]:
出现这种情况的array类似[3,4,5,6,0,1,2],此时最小数字一定在mid的右边。
low = mid + 1
(2)array[mid] == array[high]:
出现这种情况的array类似 [1,0,1,1,1] 或者[1,1,1,0,1],此时最小数字不好判断在mid左边还是右边,这时只好一个一个试 。
high = high - 1
(3)array[mid] < array[high]:
出现这种情况的array类似[2,2,3,4,5,6,6],此时最小数字一定就是array[mid]或者在mid的左边。因为右边必然都是递增的。
high = mid
注意这里有个坑:如果待查询的范围最后只剩两个数,那么mid 一定会指向下标靠前的数字
比如 array = [4,6]
array[low] = 4 ;array[mid] = 4 ; array[high] = 6 ;
如果high = mid - 1,就会产生错误, 因此high = mid
但情形(1)中low = mid + 1就不会错误