查找 (一)：静态查找表 (顺序查找、折半查找、分块查找)

最新推荐文章于 2023-01-29 11:00:04 发布

连理o

最新推荐文章于 2023-01-29 11:00:04 发布

阅读量672

点赞数 1

分类专栏：数据结构与算法文章标签：数据结构算法

本文链接：https://blog.csdn.net/weixin_42437114/article/details/107589416

版权

数据结构与算法专栏收录该内容

22 篇文章 8 订阅

订阅专栏

作为数据结构的课程笔记，以便查阅。如有出错的地方，还请多多指正！

查找表 (Search Table)：由同一类型的数据元素(或记录)构成的集合
静态查找表 (Static Search Table)：仅作查询和检索操作的查找表
动态查找表 (Dynamic Search Table)

查找算法的时间复杂度

查找算法的 基本运算 为被查找元素 $x$ 与查找表中元素的比较。因此，查找算法的 时间复杂度 即为 比较次数，平均情况下的时间复杂度 $A (n)$ 可由平均查找长度 ASL (Average Search Length) 来衡量
- ASL：为确定记录在表中的位置，需要与给定值进行比较的次数的期望值
- 对含有 $n$ 个记录的表， $ASL=\sum_{i=1}^np_ic_i$ 。 $p_i$ 为查找表中第 $i$ 个元素的概率， $c_i$ 为找到表中第 $i$ 个元素所需比较次数

顺序查找 Sequential Search

查找过程

查找过程：从表的一端开始逐个进行记录的关键字和给定值的比较
适用条件：以顺序表或线性链表表示的静态查找表

算法实现

//顺序查找
int Search_seq(SSTable_t* sstable, Key_t key)
{
	int i;

	sstable->rec[0].key = key;
	for (i = sstable->len; sstable->rec[i].key != key; --i)
	{
	}
	return i;
}

第 0 个元素起监视哨的作用。这个改进能使顺序查找在 $n\geq1000$ 时，进行一次查找的平均时间几乎减半

性能分析

ASL

表中各元素查找概率相等时
$ASL=\sum_{i=1}^np_ic_i=\frac{1}{n}\sum_{i=1}^n(n-i+1)=\frac{n+1}{2}$
表中各元素查找概率不等时
$ASL在p_n\geq p_{n-1} \geq...\geq p_2\geq p_1时取min$
因此，若能预知每个记录的查找概率，则应先对记录按查找概率进行升序排序。若查找概率无法事先测定，则可以为记录增设访问频度域，始终保持按访问频度非递减有序排列，使查找概率大的记录不断后移，或每次查找之后将刚查找到的记录直接移至表尾
当查找不成功的情形不能忽视时，假设要查找的元素 $x$ 在 $L$ 中概率是 $p$ , 且每个位置概率相等，则
$A(n)=ASL=\sum_{i=1}^ni\frac{p}{n}+(1-p)n=\frac{p(n+1)}{2}+(1-p)n$ 当 $p=\frac{1}{2}$ 时， $A(n)=ASL=\frac{3n+1}{4}\approx\frac{3n}{4}$

总结

优点：算法简单，对表的逻辑次序和存储结构无要求
缺点：平均查找长度较大

折半查找 Binary Search

查找过程

查找过程：二分法
适用条件：采用顺序存储结构的有序静态查找表

算法实现

需要注意的是，如果二分上界超过 int 型数据范围的一半，那么当欲查询元素在序列较靠后的位置时，语句 mid = (left + right) / 2 中的 left + right 就有可能超过 int 而导致溢出，此时一般使用 mid = left + (right - left) / 2 这条等价语句作为代替以避免溢出

int Binary_search(SSTable_t* sstable, Key_t key)
{
	int low = 1;
	int high = sstable->len;
	int mid = (low + high) / 2;

	while (low <= high)
	{
		if (sstable->rec[mid].key < key)
		{
			low = mid + 1;
		}
		else if (sstable->rec[mid].key > key)
		{
			high = mid - 1;
		}
		else {
			return mid;
		}
		mid = (low + high) / 2;
	}
	return 0;
}

性能分析

判定树

判定树：描述查找过程的二叉树。判定树并非完全二叉树，但它的叶结点所在层数之差最多为 1，深度与同样结点数的完全二叉树相同。因此 $n$ 个结点的判定树深度为 $\lfloor log_2n \rfloor +1$
折半查找法的比较次数不超过其判定树的深度，因此折半查找在查找成功时最多进行 $\lfloor log_2n \rfloor +1$ 次关键字比较; 查找不成功时的比较次数为判定树深度 +1

ASL

设判定树为深度为 $h$ 的满二叉树
$ASL=\sum_{i=1}^np_ic_i=\frac{1}{n}\sum_{j=1}^hj\cdot 2^{j-1}=\frac{n+1}{n}log_2(n+1)-1\approx log_2(n+1)-1$
在不等概率查找的情况下，折半查找不是有序表查找的最好方法。应使查找概率大的元素更接近判定树的根

总结

优点：平均查找长度较小
缺点：只适用于顺序存储的有序表，不适用于一般顺序表和链式存储结构

证明在每个元素的搜索概率相等时，二分查找效率最高

设有 $N$ 个数，一次分割查找后剩下数越少效率越高。设分割比为 $x$ ， $1 - x$ ，分完后剩 $n$ 个数, 则 $P (n = N x) = x ， P (n = N (1 - x)) = 1 - x$
$\therefore E(n)=Nx\cdot x + N(1-x)\cdot (1-x) = N(x^2+(1-x)^2)$ 上式在 $x = 0.5$ 时最小，即二分法查找效率最高

分块查找 / 索引顺序查找

查找过程

查找过程：将线性表分成几块，块内无序，块间有序；先确定待查记录所在块，再在块内查找
适用条件：分块有序表

算法实现

建立索引表，每个索引表结点含有一个数据域（本块最大关键字）和一个指针域（指向本块第一个结点）
索引表查找可用顺序、折半查找
块内查找只能用顺序查找
数据可用链式存储

性能分析

ASL

设 $L_b$ 为查找索引表确定所在块的平均查找长度， $L_w$ 为在块中查找元素的平均查找长度
$ASL=L_b+L_w$ 将表长为 $n$ 的表平均分成 $b$ 块，每块含 $s$ 个记录，并设表中每个记录的查找概率相等，则
用顺序查找确定所在块
$ASL=\frac{b+1}{2}+\frac{s+1}{2}$
用折半查找确定所在块
$ASL\approx log_2(b+1)+\frac{s-1}{2}$

查找方法比较

在这里插入图片描述

连理o

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
查找 (一)：静态查找表 (顺序查找、折半查找、分块查找)

作为数据结构的课程笔记，以便查阅。如有出错的地方，还请多多指正！注：C++忘得太厉害了。。算法先用C实现，等之后复习了再改成C++目录基本概念顺序查找 Sequential Search查找过程算法实现性能分析ASL总结折半查找 Binary Search查找过程算法实现性能分析判定树ASL总结*补充：证明在每个元素的搜索概率相等时，二分查找效率最高分块查找 / 索引顺序查找查找过程算法实现性能分析ASL查找方法比较基本概念查找表(Search Table)：由同一类型的数据元素(或记录)构成
复制链接

扫一扫