折半查找(Binary Search)技术,又称为二分查找。
它的前提是线性表中的记录必须是关键码有序(通常从小到大有序),线性表必须采用顺序存储。折半查找的基本思想是:在有序表中,取中间记录作为比较对象,若给定值与中间记录的关键字相等,则查找成功;若给定值小于中间记录的关键字,则在中间记录的左半区继续查找;若给定值大于中间记录的关键字,则在中间记录的右半区继续查找。不断重复上述过程,直到查找成功,或所有查找区域无记录,查找失败为止。
假设我们现在有这样一个有序表数组{0,1,16,24,35,47,59,62,73,88,99},除0下标外共10个数字。对它进行查找是否存在62这个数。我们来看折半查找的算法是如何工作的。
/* 折半查找 */
int Binary_Search(int *a, int n, int key)
{
int low, high, mid;
/* 定义最低下标为记录首位 */
low = 1;
/* 定义最高下标为记录末位 */
high = n;
while (low <= high)
{
/* 折半 */
mid = (low + high) / 2;
/* 若查找值比中值小 */
if (key < a[mid])
/* 最高下标调整到中位下标小一位 */
high = mid - 1;
/* 若查找值比中值大 */
else if (key > a[mid])
/* 最低下标调整到中位下标大一位 */
low = mid + 1;
else
/* 若相等则说明mid即为查找到的位置 */
return mid; }
return 0;
}
该算法还是比较容易理解的,同时我们也能感觉到它的效率非常高。但到底高多少?关键在于此算法的时间复杂度分析。
首先,我们将这个数组的查找过程绘制成一棵二叉树,如果查找的关键字不是中间记录47的话,折半查找等于是把静态有序查找表分成了两棵子树,即查找结果只需要找其中的一半数据记录即可,等于工作量少了一半,然后继续折半查找,效率当然是非常高了。
二叉树的性质,有过对“具有n个结点的完全二叉树的深度”性质的推导过程。在这里尽管折半查找判定二叉树并不是完全二叉树,但同样相同的推导可以得出,最坏情况是查找到关键字或查找失败的次数。
详细说明:
-
时间复杂度分析:折半查找的时间复杂度为O(logn)。在每一次比较过程中,查找表的规模减半,所以总体上需要进行的比较次数是log2n。这是因为2的x次方等于n时,x=log2n。因此,折半查找的时间复杂度是对数级别的,相比于顺序查找的线性级别O(n),效率显著提高。
-
前提条件:折半查找的前提是有序表,即查找表需要按照特定的顺序进行存储。对于静态查找表,即数据不再变化的情况下,一次排序后可以使用折半查找提高查找效率。然而,对于需要频繁插入和删除操作的数据集,维持有序性会增加工作量,此时折半查找可能不适用。
-
最优和最差情况:在最好的情况下,即目标值正好是有序表中的中间元素,只需要进行一次比较即可找到目标值,时间复杂度为O(1)。在最坏的情况下,即目标值不存在或者是有序表中的最左边或最右边的元素,需要进行log2n次比较才能确定目标值不存在,时间复杂度为O(logn)。
-
有序表的维护:折半查找要求有序表的顺序存储。如果需要频繁进行数据插入和删除操作,需要维护有序性,这可能会增加工作量。对于这种情况,可以考虑使用其他数据结构,如平衡二叉搜索树或哈希表。
综上所述,折半查找算法通过在有序数组中进行二分查找的方式,实现了在时间复杂度为O(logn)的情况下查找目标值。然而,在使用折半查找时,需要注意有序表的维护和数据集的特点。