数据结构(6) -- 查找

  1. 查找表:用于查找的数据集合

  2. 对查找表的四种操作:

    • 查询某特定元素是否在查找表中

    • 检索满足条件的某个特定的数据元素的各种属性

    • 在查找表中插入一个数据元素

    • 删除一个数据元素

  3. 静态查找表:没有插入,删除操作的查找表。查找方法:顺序查找、折半查找、散列查找

  4. 动态查找表方法:二叉排序树的查找(二叉平衡树、B树)、散列查找

  5. 平均查找长度:ASL=\sum_{i=1}^{n}P_{i}C_{i},n是查找表的长度。P_{i}是查找第i个元素的概率,C_{i}是找到第i个数据所需进行的比较次数,是查找表的长度。是查找第个元素的概率,是找到第个数据所需进行的比较次数

  6. 顺序查找:

    • 一般线性表的顺序查找

      ASL_{succeed}=\frac{n+1}{2},ASL_{failed}=n+1 

    • 缺点:当n较大时,平均查找长度较大,效率低

      优点:对数据元素存储没有要求

    • 有序表的顺序查找

      ASL_{failed}=\frac{n}{2}+\frac{n}{n+1}

  7. 折半查找:

    • 折半查找过程可以用判定树表示。圆形结点是一个记录,值为关键字值。叶节点是方形,表示查找不成功的情况。查找成功时查找长度是根节点到目的结点路径上的结点数;不成功是根节点到失败节点父节点的路径上的结点数。

    • 折半查找法查找给定值的比较次数最多不会超过树的高度。ASL_{succeed}=\log _{2}(n+1)-1

      • 折半查找时间复杂度O(log2n)

      • 折半查找只适合线性表的顺序存储结构,不适合链式存储,且要求元素按关键字有序

  8. 分块查找:

    • 查找表分若干子块,块内元素可以无序,但块之间有序。第一个块中关键字小于第二块中所有记录关键字,以此类推。再建立一个索引表,索引表中每个元素含有各块最大关键字和各块第一个元素的地址,索引表按关键字有序排列。

  9. B树

    • 所有结点的孩子结点数的最大值称B树的阶m

    • 若根节点不是终端结点,至少2棵子树,1个关键字

    • 除根节点外的所有非叶节点至少 天花板(m/2)棵子树,天花板(m/2)-1 个关键字

    • B树是所有结点的平衡因子均等于0的多路查找树

    • 一棵包含n个关键字,高度为h,阶数为m的B树:

      • \log _{m}(n+1) \leqslant h \leqslant \log _{\left \lceil m/2\right \rceil}((n+1)/2)+1
    • B树插入后小于m则直接插入,插入后大于m-1,则需分裂。(最多m-1——

    • B树删除用到最少天花板(m/2)-1个关键字

    • B树不支持顺序查找

    • 每个结点关键字个数范围:

      \left \lceil m/2\right \rceil-1\leqslant n\leqslant m-1( \leqslant n\leqslant m-1)

    • B树叶节点个数对应查找失败的情况,n个关键字,失败的可能性n+1种

  10. B+树

    • 每个分支最多m棵子树

    • 非根叶节点至少两棵子树,其他至少天花板(m/2)棵子树。

    • 结点的子树个数与关键字个数相等

    • B+树支持顺序查找

    • 叶节点包含全部关键字及指向相应记录的指针,叶节点中将关键字按大小顺序排列。分支结点只包含它的各个子节点中关键字的最大值和指针。

    • 每个结点关键字个数范围:

      \left \lceil m/2\right \rceil\leqslant n\leqslant m(1\leqslant n\leqslant m)

    • B+树非叶节点不含有关键字对应记录的存储地址

    • B+树中,无论查找成功与否,每次查找都是一条从根节点到叶节点的路径

  11. 散列表

    1. 散列函数把查找表中的关键字映射成该关键字对应的地址的函数

    2. 冲突:两个或两个以上的不同关键字映射到同一地址

    3. 同义词:发生碰撞的关键词

    4. 散列表:根据关键字直接进行访问的数据结构,查找时间复杂度O(1),与表中元素个数无关

    5. 常用散列函数:

      • 直接定址法

      • 除留余数法

      • 数字分析法

      • 平方取中法

      • 折叠法

    6. 处理冲突的方法:

      • 开放定址法

        • 线性探测法

        • 平方探测法

        • 再散列法

        • 伪随机序列法

      • 拉链法

    7. 散列表查找效率取决于3个因素:散列函数、处理冲突的方法、装填因子

    8. 装填因子:

      \alpha=\frac{n}{m},表中记录树n、散列表长度m

    9. 散列表的平均查找长度依赖于装填因子α,不直接依赖m或n。α越大,表越满

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值