简介
插值查找:也属于有序查找。是基于二分查找,做的算法优化。
比如要在取值范围1 ~ 10000 之间 100 个元素从小到大均匀分布的数组中查找5,我们自然会考虑从数组下标较小的开始查找。经过以上分析,折半查找这种查找方式,不是自适应的(也就是说是傻瓜式的)。
二分查找中查找点计算如下:
mid=(low+high)/2, 即mid=low+(high-low)/2;
通过类比,我们可以将查找的点改进为如下:
mid=low+(key-arr[low])/(arr[high]-arr[low])*(high-low);
也就是将上述的比例参数1/2改进为自适应的,根据关键字在整个有序表中所处的位置,让mid值的变化更靠近关键字key,这样也就间接地减少了比较次数。
一、算法分析
基本思想:
基于二分查找算法,将查找点的选择改进为自适应选择,可以提高查找效率。当然,差值查找也属于有序查找。对于表长较大,而关键字分布又比较均匀的查找表来说,插值查找算法的平均性能比折半查找要好的多。反之,数组中如果分布非常不均匀,那么插值查找未必是很合适的选择。
复杂度分析:
查找成功或者失败的时间复杂度均为O(log2(log2n))。
二、代码实现(Java)
public class InsertionSearch{
public static void main(String[] args){
int[] arr = {1, 2, 5, 7, 9, 10, 11, 15};
int index = insertionSearch(arr, 0, arr.length-1, 17);
System.out.println("index="+index);
}
public static int insertionSearch(int[] arr, int low, int high, int target){
if(arr==null) throw new NullPointerException();
if(low > high){
return -1;
}
int mid = low + (target-arr[low])/(arr[high]-arr[low])*(high-low);
if(mid>high || mid<low){
return -1;
}
if(target == arr[mid]){
return mid;
}else if(target < arr[mid]){
return insertionSearch(arr, low, mid-1, target);
}else{
return insertionSearch(arr, mid+1, high, target);
}
}
}