数据结构系列--查找

最新推荐文章于 2024-07-21 22:02:38 发布

殇沐

最新推荐文章于 2024-07-21 22:02:38 发布

阅读量905

点赞数

分类专栏：数据结构文章标签：数据结构

本文链接：https://blog.csdn.net/qq_36400704/article/details/108394273

版权

数据结构专栏收录该内容

15 篇文章 0 订阅

订阅专栏

“ 查找--比较淡然的一章。”

主要知识点

查找表的检索机制

平均查找长度

折半查找表

二叉排序树

哈希表

1 查找表的检索机制

本章给出了三种类型的查找表，

第一类是线性索引，记录关键字一般按序排列，以提高检索速度。对应检索采用基于比较检索方法。

第二类是树形检索，树形的典型结构是二叉排序树，其检索的时间复杂度与树的深度同级为对数函数，其对应的检索方法是基于树表式的检索，即将带查找的表组织成树，在树形结构上实现查找。

第三类是哈希结构，根据数据的”关键值”计算数据的存储地址，哈希表既是建立表，也是查找表的方法，其对应的检索方式是”计算式”的检索。

2 平均查找长度

为决定数据元素在列表中的位置，需和给定值进行比较的关键字个数的期望值，称为查找算法在查找成功时的平均查找长度。

计算平均查找长度的基本公式

对于长度为n的列表，查找成功时的平均查找长度为：

ASL=P1C1 + P2C2 +……+PnCn =∑ pici

其中pi为查找列表中第i个数据元素的概率。Ci找到列表中第i二个数据元素时，已经进行过的关键字比较次数。

计算方法：

采用公式法计算（通用），也可采用手工计算方法（具体）。针对实际的具体问题计算相应的查找成功时的平均差查找长度。

3 折半查找表

折半查找法要求查找表按照顺序存储结构且按关键字有序排列。

折半查找过程中借助于折半判定树加以描述。判定树中每一结点对应表中一个记录在表中的位置序号。

折半查找算法的性能：在等概率时查找成功的平均查找长度与折半判定树的深度相关：

折半查找算法查找速度快，平均性能好，插入删除比较困难。

4 二叉排序树

二叉排序树的定义。

二叉排序树的性质：中序遍历一个二叉排序树，可以得到一个递增有序序列。

含有n个节点的二叉排序树形态不唯一，其构造与数列的的输入顺序有关。

查找过程与折半查找过程类似，在二叉排序树中查找一个记录时，其比较次数不超过树的深度。就平均性能而言，二叉排序树上的查找和折半查找相差不大。平均查找长度依然是

二叉排序树的插入，删除操作无需移动大量结点，经常变化的动态表也采用二叉排序树结构。

5 哈希表

基本思想：以元素的关键字k为自变量，通过哈希函数h，计算其存储位置p=H（k），从而实现按照关键字计算的方式建立表与查找表。哈希表的查找过程与还是表的创建过程对应一致。

哈希法主要包括1）哈希函数的构造，2)处理冲突的方法，

构造哈希函数，常用的方法有除留余数法。

处理冲突的基本方法包括性探测再散列，二次探测再散列，链地址法等。

哈希表中影响关键字比较次数的因素有三个：哈希函数，处理冲突的方法以及哈希表的装填因子。

哈希表的平均查找长度是装填因子的函数。

【例题1】1000个记录设计哈希表.假设哈希函数是均匀的，解决冲突用线性探测再散列法，并要求在等概率的情况下查找成功时的平均查找长度不超过3，查找不成功时的平均查找长度不超过13，则哈希表长度应取多大？

解：本题要求应用公式计算平均查找长度。

已知哈希函数是均匀的，且解决冲突用线性探测再散列法时，在等概率的情况下查找成功和查找不成功时的平均查找长度为

依题意有：

解的a<=0.8.取a=0.8，由于0.8=1000/m，所以m=1250

【例题2】对以下关键字序列建立哈希表：(SUN,MON,TUE,WED,THU,FRI,SAT),哈希函数为H(K)=(K中第一个字母在字母表中的序号）MOD 7。用线性探测法处理冲突，要求构造一个装填因子为0.7的哈希表，并计算出在等概率情况下，查找成功的平均查找长度和不成功的平均查找长。

解：此题主要要求掌握手工计算平均查找长度的方法，

装填因子为0.7，根据公式，装填因子 = 元素个数/表长，知哈希表长度为=7/0.7=10.

各关键字第一个字母的序号分别为19(S)，13(M)，20(T),23(W），6（F）。

建立哈希表, 成功的平均查找长度, 不成功的平均查找长度

计算各关键字的哈希地址

H(SUN)=19mod7=5;

H(MON)=13mod7=6;H(TUE)=19mod7=6;

H1(TUE)=(6+1)mod10=7;

H(WED)=23mod7=2;

H(THU)=20mod7=6 (与MON冲突)

H1(THU)=(6+1)mod10=7; (与TUE冲突)

H2(THU)=(6+2)mod10=8;

H(FRI)=6mod7=6; (与MON冲突)

H1(FRI)=(6+1)mod10=7; (与TUE冲突)

H2(FRI)=(6+2)mod10=8; (与TUE冲突)

H3(FRI)=(6+3)mod10=9;

H(SAT)=19mod7=5; (与SUN冲突)

H1(SAT)=(5+1)mod10=6; (与MON冲突)

H2(SAT)=(5+2)mod10=7; (与TUE冲突)

H3(SAT)=(5+3)mod10=8; (与THU冲突)

H4(SAT)=(5+4)mod10=9; (与FRI冲突)

H5(SAT)=(5+15)mod10=0;

由上可得构造哈希表：

0	1	2	3	4	5	6	7	8	9
SAT		WED			SUN	MON	TUE	THU	FRI
6		1			1	1	2	3	4

按查找成功的平均查找长度：

对于SUN,查找时所需的比较次数为1

对于MON,查找时所需的比较次数为1

对于TUE,查找时所需的比较次数为2

对于WED,查找时所需的比较次数为1

对于THU,查找时所需的比较次数为3

对于FRI,查找时所需的比较次数为4

对于SAT,查找时所需的比较次数为6

根据等概率下查找成功的平均查找长度计算公式可得

计算查找不成功的平均查找长度：

哈希函数值为0时，查找不成功时的比较次数为2

哈希函数值为1时，查找不成功时的比较次数为1

哈希函数值为2时，查找不成功时的比较次数为2

哈希函数值为3时，查找不成功时的比较次数为1

哈希函数值为4时，查找不成功时的比较次数为1

哈希函数值为5时，查找不成功时的比较次数为7

哈希函数值为6时，查找不成功时的比较次数为6

由等概率下查找不成功的平均查找长度计算公式得:

【例题3】已知某哈希表的装填因子小于1，哈希函数H(key)为关键字(标识符）的第一个字母在字母表当中的序号，处理冲突的方法为线性探测开放定址法。

一，编写按第一个字母的顺序输出哈希表中所有关键字的算法。

二，编写模拟手工计算等的概率情况下查找不成功的平均查找长度算法。

实现步骤：

1 对字母序号为i，可先从该字母序号位置开始判断该处所存的关键词是否为i；

2 如果相同，则表示该关键词为与序号i对应的关键字，输出该值；

3 若不同，则表示该关键词并非为字母序号i对应的关键字，不输出；

4 按线性探测开放定址法继续判断下一个关键词，直到值为空；

5 字母序号从1到26，持续上述步骤，则可得个按字母序号输出的所有关键字序列。

void printword(HsahTable ht)
  {
  int i,j;
  for(i=1;i<=26;i++)// 字母序号从1-》26输出所有关键字序列
    {
      j=1;// 从字母序号为i的位置开始判断
      while(ht[j].key !=NULLKEY)
        {
          if(hash(ht[j].key == i)// 若该关键字的哈希地址为i，则输出该关键字
          printf("%s\n",ht[j].key);
          j=(j+1)%m;// 按线性探测处理冲突
        }
    }
}