数据结构与算法——11. 二分查找

二分查找

对于有序表,我们有一种比顺序查找更加优秀的查找算法。那就是二分查找算法。

假设有一个从小到大排序的列表。我们从列表中间的项进行对比,如果匹配查找项,则查找结束;如果不匹配,那么就有两种情况:

  1. 列表中间项比查找项大,那么查找项只可能出现在前半部分;

    123579112536
    目标中间项
  2. 列表中间项比查找项小,那么查找项只可能出现在后半部分。

    12357
    中间项目标

但无论如何,我们都要将比对范围缩小到原来的一半:n/2。

然后继续采用上述方法进行查找,查找范围变为列表的前半部分或后半部分,继续查找……。直到找到目标数据项或者不能再继续缩小范围为止。

1. python代码实现

def binary_search(a_list, item):
    """
    二分查找
    :param a_list: 被查找列表
    :param item: 目标元素
    :returns: 元素是否在列表中被找到
    """
    # 初始化列表首端
    first = 0
    # 初始化列表尾端
    last = len(a_list) - 1

    while first <= last:
        # 计算出中间元素的索引
        midpoint = (first + last) // 2
        # 如果中间元素等于目标元素,则查找成功
        if a_list[midpoint] == item:
            return True
        # 如果中间元素大于目标元素,则目标元素在当前列表的前半部分
        elif a_list[midpoint] > item:
            last = midpoint - 1
        # 如果中间元素小于目标元素,则目标元素在当前列表的后半部分
        else:
            first = midpoint + 1
    # 循环完还没找到,则查找失败
    return False

2. 递归算法实现

二分查找算法实际上体现了解决问题的典型策略:分而治之
将问题分为若干更小规模的部分通过解决每一个小规模部分问题,并将结果汇总得到原问题的解。

因此,二分法也适合用递归算法来实现(因为递归算法也是一种典型的分治策略算法):

def binary_search(a_list, item):
    """
    二分查找
    :param a_list: 被查找列表
    :param item: 目标元素
    :returns: 元素是否在列表中被找到
    """
    list_size = len(a_list)
    # 递归出口
    if len(a_list) == 0:
        return False
    else:
        midpoint = list_size // 2
        if a_list[midpoint] == item:
            return True
        elif a_list[midpoint] > item:
            # 递归调用:使用切片操作取出列表后半部分,由于切片是左闭右开区间,所以不用减一
            return binary_search(a_list[0:midpoint], item)
        else:
            # 递归调用:使用切片操作取出列表前半部分
            return binary_search(a_list[midpoint + 1 :], item)

3. 算法分析

由于二分查找,每次比对都将下一步的比对范围缩小一半。所以,每次比对后剩余数据项如下表所示:

对比剩余的元素数量
1 n / 2 n/2 n/2
2 n / 4 n/4 n/4
3 n / 8 n/8 n/8
i \text i i n / 2 i n/2^i n/2i

当比对次数足够多以后,比对范围内就会仅剩余1个数据项。无论这个数据项是否匹配查找项,比对最终都会结束,接下列方程:

n 2 i = 1 \frac {n}{2^i}=1 2in=1得到: i = log ⁡ 2 ( n ) i=\log_2(n) i=log2(n),所以二分查找算法的复杂度是 O ( log ⁡ n ) O(\log n) O(logn)

4. 二分查找的进一步思考

在递归算法实现的二分查找算法中除了比对,还有一个因素需要
注意到:切片操作。这一操作的算法复杂度是 O ( k ) O(k) O(k),这使得整个算法的复杂度稍有增加。但这仅仅是为了可读性更好,它完全可以通过传入首尾端索引的方式来代替。

另外,虽然二分查找在时间复杂度上优于顺序查找。但也要考虑到对数据项进行排序的开销

  • 如果一次排序后,可以进行多次查找,那么排序的开销就可以忽略。
  • 如果数据集经常变动,排序完成后查找不了几次,那么还是直接用无序表加上顺序查找来得经济。

所以,在算法选择的问题上,光看时间复杂度的优劣是不够的,还需要考虑到实际应用的情况。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
算法数据结构它们分别涵盖了以下主要内容: 数据结构(Data Structures): 逻辑结构:描述数据元素之间的逻辑关系,如线性结构(如数组、链表)、树形结构(如二叉树、堆、B树)、图结构(有向图、无向图等)以及集合和队列等抽象数据类型。 存储结构(物理结构):描述数据在计算机中如何具体存储。例如,数组的连续存储,链表的动态分配节点,树和图的邻接矩阵或邻接表表示等。 基本操作:针对每种数据结构,定义了一系列基本的操作,包括但不限于插入、删除、查找、更新、遍历等,并分析这些操作的时间复杂度和空间复杂度。 算法算法设计:研究如何将解决问题的步骤形式化为一系列指令,使得计算机可以执行以求解问题。 算法特性:包括输入、输出、有穷性、确定性和可行性。即一个有效的算法必须能在有限步骤内结束,并且对于给定的输入产生唯一的确定输出。 算法分类:排序算法(如冒泡排序、快速排序、归并排序),查找算法(如顺序查找二分查找、哈希查找),图论算法(如Dijkstra最短路径算法、Floyd-Warshall算法、Prim最小生成树算法),动态规划,贪心算法,回溯法,分支限界法等。 算法分析:通过数学方法分析算法的时间复杂度(运行时间随数据规模增长的速度)和空间复杂度(所需内存大小)来评估其效率。 学习算法数据结构不仅有助于理解程序的内部工作原理,更能帮助开发人员编写出高效、稳定和易于维护的软件系统。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

花_城

你的鼓励就是我最大的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值