在介绍差值查找之前,首先考虑一个新问题,为什么上述算法一定要是折半,而不是折四分之一或者折更多呢?
打个比方,在英文字典里面查“apple”,你下意识翻开字典是翻前面的书页还是后面的书页呢?如果再让你查“zoo”,你又怎么查?很显然,这里你绝对不会是从中间开始查起,而是有一定目的的往前或往后翻。
同样的,比如要在取值范围1 ~ 10000 之间 100 个元素从小到大均匀分布的数组中查找5, 我们自然会考虑从数组下标较小的开始查找。
经过以上分析,折半查找这种查找方式,不是自适应的(也就是说是傻瓜式的)。二分查找中查找点计算如下:
mid=(low+high)/2, 即mid=low+1/2(high-low);*
通过类比,我们可以将查找的点改进为如下:
mid=low+(key-a[low])/(a[high]-a[low])*(high-low),
也就是将上述的比例参数1/2改进为自适应的,也就是将1/2改进为 (key-a[low])/(a[high]-a[low])。根据关键字在整个有序表中所处的位置,让mid值的变化更靠近关键字key,这样也就间接地减少了比较次数。
**基本思想:**基于二分查找算法,将查找点的选择改进为自适应选择,可以提高查找效率。当然,差值查找也属于有序查找。
**注:**对于表长较大,而关键字分布又比较均匀的查找表来说,插值查找算法的平均性能比折半查找要好的多。反之,数组中如果分布非常不均匀,那么插值查找未必是很合适的选择。
**复杂度:**查找成功或者失败的时间复杂度均为O()
代码实现(递归和非递归):
/*
* 插值查找 对二分查找的优化 数据是有序的
* 二分查找中差值计算公式为:mid=(low+high)/2=low+(high-low)/2
* 而在插值查找中差值计算公式为:mid=low+(high-low)*(key-a[low])/(a[high]-a[low])
* 也就是将1/2改进为 (key-a[low])/(a[high]-a[low])
*
* 插值查找用于 数据分布均匀的顺序表
* */
public class InterpolationSearch {
//插值查找非递归实现
public static int search(int[] a,int key) {
int low=0;
int high=a.length-1;
int mid = 0;
while (low<high) {
mid=low+(high-low)*(key-a[low])/(a[high]-a[low]);
if (key<a[mid]) {
high=mid-1;
}
else if (key>a[mid]) {
low=mid+1;
}
else {
return mid;
}
}
return -1;
}
//插值查找递归实现
public static int search(int[] a,int low,int high,int key) {
while (low<high) {
int mid=low+(high-low)*(key-a[low])/(a[high]-a[low]);
if (key<a[mid]) {
search(a, low, mid-1, key);
}
else if (key>a[mid]) {
search(a, mid+1, high, key);
}
else {
return mid;
}
}
return -1;
}
public static void main(String[] args) {
int[] a= {1,3,4,5,6,8};
int low=0;
int high=a.length-1;
int i=search(a, 4);
System.out.println("非递归查找位置在"+(i+1));
System.out.println("===============");
int j=search(a, low, high, 4);
System.out.println("递归查找位置在"+(j+1));
}
}
插值算法中带你在于:
mid=low+(key-a[low])/(a[high]-a[low])*(high-low)
具体实现和二分查找大致相同,不同在于mid计算公式