二分查找也叫折半查找,时间复杂度为 O(log n),是一种高效的查找算法,它的前提是数据必须是有序的(当然并不绝对,在某些问题如局部最小值查找时可以无序)。二分查找的基本思路是将待查找的区间不断折半,直到找到目标数据或者区间被缩小为空。
基本情况不在细说,接下来我主要说明一下初学者常遇见的问题,也就是边界问题。
public static boolean numFind(int[]arr,int x){ int l=0,r=arr.length-1,mid=0; while(l<=r){ mid=l+((r-l)>>1); if(arr[mid]>x){ r=mid-1; }else if(arr[mid]<x){ l=mid+1; }else { return true; } } return false; }
这是一个简单的二分查找,目的是找到确定的一个值的存在与否,故必须对每一个元素均进行条件上的判断,也就是(l<=r)中"="号的由来。
public static int zuiYou(int[]arr,int num){ int l=0,r=arr.length-1,mid=0; if(arr.length==0) return -1; while(l<r){ mid=l+((r-l)>>1); if(arr[mid]>=num){ r=mid; }else{ l=mid+1; } } return l;//或者r }
在来看这个例子,这是用二分查找来找到大于num的最左边的值,这个值可以是num,也可以是大于num的某个值,而且它必然存在(当然默认的前提条件是arr[arr.length-1]>=num),故其实没必要对每一个值进行判断,只需要把arr.length-2个值排除掉,剩余的那一个即为所求值,这就是(l<r)不加等号的原因。
其次,你会发现两段代码中对r的处理也稍有不同。
第一段r=mid-1;第二段 r=mid;而对l的处理都是l=mid+1;
事实上这是分析之后必然的结果。
先说结论:如果(l<=r),则必有(l=mid+1)和(r=mid-1);
如果(l<r),则必有(l=mid+1),对r无直接要求.(其实也有一个前提条件是mid=l+(l+r)/2而不是mid=l+(l+r+1)/2,否则就会对r来进行-1的更新了).
这个结论的得出仅是为了避免程序陷入死循环的必要条件。
当然,事无绝对,第二段代码也可以改写成(l<=r)的形式,不过此时必须要额外引入一个变量用来记录mid的值。
public static int zuiYou2(int[]arr,int num){ int l=0,r=arr.length-1,mid=0; int val=0; if(arr.length==0) return -1; else if(arr[arr.length-1]<num) return arr.length-1; while(l<=r){ mid=l+((r-l)>>1); if(arr[mid]>=num){ val=mid; r=mid-1; }else{ l=mid+1; } } return val; }
此时r就必须等于mid-1了。
大家可以练习一道题来检验学习成果:
编写一个方法在一个无序数组中找到任意一个局部最小值并返回对应的下标。
相关二分法细节更多,在下一篇文章中说明。