二分查找
二分查找是一种非常简单易懂的快速查找算法,
二分查找针对的是一个有序的数据集合,查找思想有点类似分治思想。每次都通过跟区间的中间元素对比,将待查找的区间缩小为之前的一半,直到找到要查找的元素,或者区间被缩小为0。
O(logn)惊人的查找速度
二分查找每一次操作都会减少一半的数据,比如2的三十二次方是四十多亿,即便四十多亿条数据用二分查找只需要三十二次就行了。
//非递归代码实现
public int bsearch(int[] a, int n, int value) {
int low = 0;
int higt= n - 1;
while (low <= high) {
int mid =low+(higt-low)>>1;
if (a[mid] == value) {
return mid;
} else if (a[mid] < value) {
low = mid + 1;
} else {
higt= mid - 1;
}
}
return -1;
}
//递归代码实现
public class BinaryRecursive {
public static void main(String[] args) {
int[] data=new int[]{1,2,3,4,5,6,7,8,9,10};
System.out.println(BinaryInternally(data,0,9,6));
}
public static int BinaryInternally(int[] a, int low,int higt,int value){
if (low>higt) return -1;
int mid=low+((higt-low)>>1);
if (a[mid]>value){
return BinaryInternally(a,low,mid-1,value);
}else if(a[mid]<value){
return BinaryInternally(a,mid+1,higt,value);
}else {
return mid;
}
}
}
二分查找容易出错的三个地方
1.循环退出条件
low<=high,而不是low<high.
2.mid的取值
mid=(low+high)/2,这种写法存在一定的安全隐患,如果low和high比较大的话,容易溢出,就比如java中int类型占四个字节,而int类型正整数的范围是2的31次方2147483648,如果low是1而high是2147483648,它们俩相加就变成了-2147483648。
所以为了安全起见mid=low+(high-low)/2;如果考虑性能上的话,可以mid=low+((high-low)>>1),相比除法运算,位运算要快的多。
3.low和high的更新
记住low是mid-1,high是mid+1,如果是等于mid话,可能会造成死循环。
二分查找应用的局限性
1.二分查找依赖的时顺序表结构,简单来说就是数组,能不能用链表呢,可以但是时间复杂度太高,链表的随机访问时间复杂时O(n)。
2.二分查找针对的是有序数据,二分查找之前要排序,时间复杂度瞬间就增加了。
3.数据量太大或者太小不适合二分查找,为什么呢,如果数据量太小的话,跟本没必要用二分查找算法,直接顺序遍历就行,查找的速度差不多,不过还是推荐使用二分查找。如果数据量太大的话,占用的连续内存比较大,因为二分查找是基于数组的吗,就算再2G的内存中,也不太可能出现1G(假如数据量是1G)的内存。