从折半查找的过程看,以有序表的中间记录作为比较对象,并以中间记录将表分割为两个子表,对子表继续这种操作。所以,对表中每个记录的查找过程,可用二叉树来描述,树中的每个节点对应有序表中的一个记录,结点的值为该记录在表中的位置。通常称这个描述折半查找过程中的二叉树为折半查找判定树,简称判定树。
折半查找判定树具有如下性质:
(1) 任意两棵折半查找判定树,若它们的结点个数相同,则它们的结构完全相同;
(2) 具有n个节点的折半查找判定树的深度为[log2n]+1;
(3) 任意两个叶子所处的层数最多相差1。
7.3树表的查找技术
7.3.1 二叉排序表
二叉排序树又称二叉查找树,它或者是一颗空的二叉树,或者是具有下列性质的二叉树:
⑴若它的左子树不空,则左子树上的所有结点的值均小于根结点的值;
⑵若它的右子树不空,则右子树上的所有结点的值均大于根结点的值;
⑶它的左右子树也都是二叉排序树。
待排文件的常用存储方式
(1) 以顺序表(或直接用向量)作为存储结构
排序过程:对记录本身进行物理重排(即通过关键字之间的比较判定,将记录移到合适的位置)
(2) 以链表作为存储结构
排序过程:无须移动记录,仅需修改指针。通常将这类排序称为链表(或链式)排序;
(3) 用顺序的方式存储待排序的记录,但同时建立一个辅助表(如包括关键字和指向记录位置的指针组成的索引表)
排序过程:只需对辅助表的表目进行物理重排(即只移动辅助表的表目,而不移动记录本身)。适用于难于在链表上实现,仍需避免排序过程中移动记录的排序方法
排序算法性能评价
(1) 评价排序算法好坏的标准
评价排序算法好坏的标准主要有两条:
① 执行时间和所需的辅助空间
② 算法本身的复杂程度
(2) 排序算法的空间复杂度
若排序算法所需的辅助空间并不依赖于问题的规模n,即辅助空间是O(1),则称之为就地排序(In-PlaceSou)。
非就地排序一般要求的辅助空间为O(n)。
(3) 排序算法的时间开销
大多数排序算法的时间开销主要是关键字之间的比较和记录的移动。有的排序算法其执行时间不仅依赖于问题的规模,还取决于输入实例中数据的状态。