数据结构查找

最新推荐文章于 2023-01-16 15:43:10 发布

qq_43628810

最新推荐文章于 2023-01-16 15:43:10 发布

阅读量179

点赞数

分类专栏：笔记

本文链接：https://blog.csdn.net/qq_43628810/article/details/103609325

版权

笔记专栏收录该内容

3 篇文章 0 订阅

订阅专栏

查找

查找的基本概念c
列表：由同一类型的数据元素组成的集合。
关键码：数据元素中的某个数据项，可以标识列表中的一个或一组数据元素。
键值：关键码的值。
主关键码：可以唯一地标识一个记录的关键码。
次关键码：不能唯一地标识一个记录的关键码。

查找：在具有相同类型的记录构成的集合中找出满足给定条件的记录。

查找的结果：若在查找集合中找到了与给定值相匹配的记录，则称查找成功；否则，称查找失败。

静态查找适用于：查找集合一经生成，便只对其进行查找，而不进行插入和删除操作; 或经过一段时间的查找之后，集中地进行插入和删除等修改操作。

动态查找适用于：查找与插入和删除操作在同一个阶段进行。

线性表：适用于静态查找，主要采用顺序查找技术、折半查找技术。
树表：适用于动态查找，主要采用二叉排序树的查找技术。
散列表：静态查找和动态查找均适用，主要采用散列技术。

查找算法的性能（通过关键码的比较次数来度量）
影响因素：（1）算法（2）问题规模（3）待查关键码在查找集合里的位置（4）查找频率
注：查找频率取决于具体应用。通常是已知的。

平均查找长度（关键码的比较次数）
查找成功（ASLsucc)/失败（ASLusucc）时：ASL=p1c1+p2c2+…+pn*cn
n为查找集合中记录的个数；pi为查找第i个记录的概率；ci为查找第i个记录所需关键码比较的次数

线性表的查找技术
顺序查找（线性查找）
从线性表的一端向另一端逐个将关键码与给定值进行比较，
如果相等，则查找成功，给出该记录在表中的位置；
如果整个表检测完仍未找到与给定值相等的关键码，则查找失败，给出失败信息。

带监视哨的顺序查找
   设置“哨兵”（待查值），将哨兵放在查找方向的尽头处，免去了在查找过程中每一次比较后都       要     判断查找位置是否越界，从而提高查找速度。
   int i = length;        //从数组高端开始比较
   data[0] = k;           //设置哨兵
   while (data[i] != k) //不用判断下标i是否越界

顺序查找的优点
   算法简单而且使用面广。
   对表中记录的存储结构没有任何要求，顺序存储和链接存储均可；
   对表中记录的有序性也没有要求，无论记录是否按关键码有序均可。
顺序查找的缺点
   平均查找长度较大，特别是当待查找集合中元素较多时，查找效率较低。

折半查找
条件：线性表中的记录必须按关键码有序
必须采用顺序存储
基本思想：在有序表中（low, high,low<=high）
取中间记录作为比较对象
若给定值与中间记录的关键码相等，则查找成功
若给定值小于中间记录的关键码，则在中间记录的左半区继续查找
若给定值大于中间记录的关键码，则在中间记录的右半区继续查找
不断重复上述过程，直到查找成功，或所查找的区域无记录，查找失败
折半查找判定树
判定树：折半查找的过程可以用二叉树来描述
树中的每个结点对应有序表中的一个记录
结点的值为该记录在表中的位置
通常称这个描述折半查找过程的二叉树为折半查找判定树，简称判定树
折半查找判定树的根结点为mid=(n+1)/2，
任意两棵折半查找判定树，若它们的结点个数相同，则它们的结构完全相同
判定树的性质
任意结点的左右子树中结点个数最多相差1
任意结点的左右子树的高度最多相差1
任意两个叶子所处的层次最多相差1

树表的查找技术
线性表查找特点
线性表查找是静态的查找，要在线性表上进行动态查找，存在以下的问题：
无序顺序表上进行动态查找，插入操作简单，但查找的复杂性高
有序顺序表上进行动态查找，查找的时间复杂性好，但是插入操作时间复杂性高
单链表上进行动态查找，插入操作简单，但查找操作复杂性高

   解决办法：
   采用二叉树这种数据结构，实现动态查找

二叉排序树
二叉排序树（也称二叉查找树）：或者是一棵空的二叉树，或者是具有下列性质的二叉树：
⑴若它的左子树不空，则左子树上所有结点的值均小于根结点的值；
⑵若它的右子树不空，则右子树上所有结点的值均大于根结点的值；
⑶ 它的左右子树也都是二叉排序树。
注：中序遍历二叉排序树可以得到一个按关键码有序的序列

平衡二叉树（AVL树）
平衡二叉树：或者是一棵空的二叉排序树，或者是具有下列性质的二叉排序树：
⑴ 根结点的左子树和右子树的深度最多相差1;
⑵ 根结点的左子树和右子树也都是平衡二叉树。

   注：平衡因子：结点的平衡因子是该结点的左子树的深度与右子树的深度之差。 
       在平衡树中，结点的平衡因子可以是1，0，-1。

   最小不平衡子树：在平衡二叉树的构造过程中，以距离插入结点最近的、且平衡因子的绝对值大       于1的结点为根的子树。 

   在构造二叉排序树的过程中，每插入一个结点时，首先检查是否因插入而破坏了树的平衡性
   若是，则找出最小不平衡子树，在保持二叉排序树特性的前提下，调整最小不平衡子树中各结点       之间的链接关系，进行相应的旋转，使之成为新的平衡子树。
   
   设结点A为最小不平衡子树的根结点，对该子树进行平衡调整归纳起来有以下四种情况：
   1. LL型
   2. RR型
   3. LR型
   4. RL型


  在一个平衡二叉排序树上插入一个新结点S时，主要包括以下三步： 
    （1） 查找应插位置， 同时记录离插入位置最近的可能失衡结点A（A的平衡因子不等于0）。 
    （2） 插入新结点S， 并修改从A到S路径上各结点的平衡因子。 
    （3） 根据A、 B的平衡因子， 判断是否失衡以及失衡类型， 并做相应处理。

B树（适合在磁盘等直接存取设备上组织动态的查找表）
m阶B-树：是满足下列特性的树
(1) 树中每个结点至多有m棵子树；
(2) 若根结点不是终端结点，则至少有两棵子树；
(3) 除根结点外，其他非终端结点至少有?m/2? 棵子树；
(4)所有非终端结点都包含以下数据：
（n，A0，K1，A1，K2，…，Kn，An）
其中，n（?m/2? ?1≤n≤m ?1）为关键码的个数；
Ki（1≤i≤n）为关键码，且Ki＜Ki+1（1≤i≤n-1）；
Ai（0≤i≤n）为指向子树根结点的指针，且指针Ai所指子树中所有结点的关键码均小于Ki+1大于 Ki。
(5)所有叶子结点都在同一层上，B树是高平衡的。

m阶B+树定义
(1)每个结点至多有m个子结点；
(2)每个结点(除根外)至少有ceiling(m/2)个子结点；
(3)根结点至少有两个子结点；
(4)有k个子结点的结点必有k个关键码。
m阶B＋树特性
⑴ 含有m个关键码，每一个关键码对应一棵子树。
⑵ 关键码Ki是它所对应的子树的根结点中的最大（或最小）关键码。
⑶ 所有终端结点中包含了全部关键码信息，以及指向关键码记录的指针。
⑷ 所有终端结点按关键码的大小链在一起，形成单链表，并设置头指针。

B+和B-树特点
对于阶数相同的两棵树，每个节点所包含的分支数的定义相同（不能少于m/2,不能多于m)
每个节点所包含的关键字的个数不同
B-树中，关键字不重复出现；B+树中，叶子节点存放所有的关键字，内部结点存储着其后继节点中最大的关键字
插入操作都会引起节点的分裂
删除操作都会引起节点的合并
B-树适用于随机检索；B+树支持随机和顺序检索

散列表（hash）的查找技术
散列的基本思想：在记录的存储地址和它的关键码之间建立一个确定的对应关系。这样，不经过比较，一次读取就能得到所查元素的查找方法。
散列表：采用散列技术将记录存储在一块连续的存储空间中，这块连续的存储空间称为散列表。
散列函数：将关键码映射为散列表中适当存储位置的函数。
散列地址：由散列函数所得的存储位置址。
冲突：对于两个不同关键码ki≠kj，有H(ki)＝H(kj)，即两个不同的记录需要存放在同一个存储位置,ki和kj相对于H称做同义词。

散列函数
   设计散列函数一般应遵循以下原则：
   ⑴ 计算简单。散列函数不应该有很大的计算量，否则会降低查找效率。
   ⑵ 函数值即散列地址分布均匀。函数值要尽量均匀散布在地址空间，这样才能保证存储空间的          有效利用并减少冲突。
   
   直接定址法：
   H(key) = a ? key + b  （a，b为常数）
   适用：事先知道关键码，关键码集合不是很大且连续性较好
   
   除留余数法
   H(key)=key  mod  p 
   一般情况下，选p为小于或等于表长（最好接近表长）的最小素数
   除留余数法是一种最简单、也是最常用的构造散列函数的方法，并且不要求事先知道关键码的分       布

   数字分析法
   根据关键码在各个位上的分布情况，选取分布比较均匀的若干位组成散列地址。 
   适用：事先知道关键码的分布，
         关键码的分布均匀

   平方取中法
   对关键码平方后，按散列表大小，取中间的若干位作为散列地址（平方后截取）。 
   适用：事先不知道关键码的分布且关键码的位数不是很大。

   折叠法
   将关键码从左到右分割成位数相等的几部分，将这几部分叠加求和，取后几位作为散列地址。 
   适用：关键码位数很多，事先不知道关键码的分布。

qq_43628810

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据结构查找

查找查找的基本概念c列表：由同一类型的数据元素组成的集合。关键码：数据元素中的某个数据项，可以标识列表中的一个或一组数据元素。键值：关键码的值。主关键码：可以唯一地标识一个记录的关键码。次关键码：不能唯一地标识一个记录的关键码。查找：在具有相同类型的记录构成的集合中找出满足给定条件的记录。查找的结果：若在查找集合中找到了与给定值相匹配的记录，则称查找成功；否则，称查找失败。静...
复制链接

扫一扫