1.基本思想
回顾一下二分查找法的优缺点,二分查找相比于顺序查找效率提高不少(前提待排序的数组是顺序的),但对于有目的性的查找,比如想在一个字典中想查找banana,这个时候你还会选择二分查找吗?因为b这个字母在字典中的位置前列。换句话说,针对于不同的单词,结合我们的先验知识,自适应地翻到响应的页码。
经过以上分析,折半查找这种查找方式,不是自适应的(也就是说是傻瓜式的)。二分查找中查找点计算如下:
mid=(low+high)/2, 即mid=low+1/2(high-low);*
通过类比,我们可以将查找的点改进为如下:
mid=low+(key-a[low])/(a[high]-a[low])*(high-low),
也就是将上述的比例参数1/2改进为自适应的,根据关键字在整个有序表中所处的位置,让mid值的变化更靠近关键字key,这样也就间接地减少了比较次数。
对于表长较大,而关键字分布又比较均匀的查找表来说,插值查找算法的平均性能比折半查找要好的多。反之,数组中如果分布非常不均匀,那么插值查找未必是很合适的选择。
2.算法步骤
待搜索的数据集一定是顺序的,若不是顺序的,则先进行排序!!!
无论是迭代法还是递归法,查找算法的基本思想都是一样的!
算法实现的代码唯一不同就是mid的计算关系式不一样!
3.代码实现
3.1.算法实现
3.1.1.迭代法
//插值查找
int InsertionSearch_iteration(int a[], int value, int n)
{
int low, high, mid = 0;//这里的low、high、mid是索引值
low = 0;
high = n - 1;
if (value > a[high] || value < a[low])//不在范围直接返回
return -1;
while (low <= high)//当low == high 为最后一次检查,如果还不相同则返回
{
mid = low + (value - a[low]) / (a[high] - a[low]) * (high - low); //mid的计算方式改变一下即可
//如果low + high等于奇数,向下取整。也就是左边
if (a[mid] == value)//匹配到直接返回
return mid;
if (a[mid] > value)//如果是最后一次,即left==right,则high<low
high = mid - 1;//跳出while大循环
else
low = mid + 1;
}
return -1;
}
3.1.2.递归法
int InsertionSearch_recursive(int a[], int value, int low, int high)
{
if (value > a[high] || value < a[low])//不在范围直接返回
return -1;
int mid = low + (value - a[low]) / (a[high] - a[low]) * (high - low);//更改一下递推关系式
if (a[mid] == value)//递归的终止条件,前提是value在数组中存在
return mid;
if (low == high)//这已经是最后一次查找了,这一次value还不相同,则返回
{//由于只会往某种特定的方向递归,而不会出现先左递归回溯再后右递归回溯,所以low==high 是递归的最后一次。由于上面一个语句已经检查了,如果没有直接返回,那么就意味着value不相同,直接返回-1即可
return -1;
}
if (a[mid] > value)//只会往某种特定的方向递归,而不会出现先左递归后右递归
return InsertionSearch_recursive(a, value, low, mid - 1);
else
return InsertionSearch_recursive(a, value, mid + 1, high);
}
3.2.测试程序
void main()
{
int a[] = {0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15};//数组一定是顺序的
//待搜索的数据集中包含value值
int recv_iter = InsertionSearch_iteration(a,13,15);//找到返回索引值,否则-1
int recv_recu = InsertionSearch_recursive(a, 20, 0, 16 - 1);
if (recv_iter != -1)
{
printf("\nrecv_iter offset position is :%d", recv_iter);
}
else
{
printf("\nrecv_iter can not find value \n");
}
if (recv_recu != -1)
{
printf("\nrecv_recu offset position is :%d", recv_recu);
}
else
{
printf("\nrecv_recu can not find value \n");
}
//待搜索的数据集中没有包含value值
int recv_iter_1 = InsertionSearch_iteration(a, 16, 16);//找到返回索引值,否则-1
int recv_recu_1 = InsertionSearch_recursive(a, 16, 0, 16 - 1);
if (recv_iter_1 != -1)
{
printf("\nrecv_iter_1 offset position is :%d", recv_iter_1);
}
else
{
printf("\nrecv_iter_1 can not find value \n");
}
if (recv_recu_1 != -1)
{
printf("recv_recu_1 offset position is :%d", recv_recu_1);
}
else
{
printf("recv_recu_1 can not find value \n");
}
system("pause");
}
4.程序细节
让我们再来看看mid的关系式:
mid=low+(key-a[low])/(a[high]-a[low])*(high-low),
不知道大家有没有发现什么问题,如果我们想自适应地进行查找,前提是:
key值在a[low]和a[high]之间
数组是顺序的 a[low] 代表最小值 a[high]代表最大值
因此我们要在算法中进行检查参数,而在二分排序法中却不需要!