最近学习老韩的数据结构与算法,看到插值查找算法的公式,试了几个例子后很巧妙,画图后,发现了它的数学原理
一个有序数组,我们不妨设 int arr[ ] = {1,3,5,9,10,12,15}
若要查找其中一个数据的下标,我们用插值算法公式:
low 为数组最左端下标,通常为0,high为数组最右端下标,通常为arr.length - 1
key为要查找的数据的值,index为与key相等的数组元素的下标
我们不妨设要查找的数为9,则带入数据到公式为index = [(9 - 1) / (15 - 1)] * (6 - 0)
= 24 / 7
向下取整为3(int自动向下取整)
而这正好是我们要查找的数组元素的下标
下面解释原理:
我们不妨把一个升序数组看做一个单调递增的函数
用红色线与蓝色线圈出的三角形可近似看作一对儿相似三角形
而我们知道相似三角形有如下等式:
整理可得:
而我们的公式:
故此公式的值正好近似于我们要找的index
而我们大家回想一下插值查找算法的应用场景:在呈现均匀分布特征的数据中,使用插值算法查找较好。
这是为什么呢?
原理就是我们第一步把两个三角形看作相似的操作
试想一下:
若这组数据波动很厉害,那么它呈现出的函数图像波动也很大,而我们这时若还是把红蓝三角形看作相似,会引起很大的误差,所以此时需要递归进行多次查找。
下面附上插值查找方法的java代码:
public static int insertValueSearch(int[] arr, int left, int right, int findVal) {
System.out.println("插值查找次数~~"); //出现几次该语句就是调用了几次该方法,也就是它对应的查找次数
//注意:findVal < arr[0] 和 findVal > arr[arr.length - 1] 必须需要
//否则我们得到的 index 可能越界
if (left > right || findVal < arr[0] || findVal > arr[arr.length - 1]) {
return -1;
}
int index = left + (right - left) * (findVal - arr[left]) / (arr[right] - arr[left]);
int key = arr[index];
if (findVal > key) { // 说明应该向右边递归
return insertValueSearch(arr, index + 1, right, findVal);
} else if (findVal < key) { // 说明向左递归查找
return insertValueSearch(arr, left, index - 1, findVal);
} else {
return index;
}
}