相关定义
- 查找表
- 关键字(key),关键码
- 主关键字(primary key),主关键码
- 此关键字(secondary key),次关键码
- 静态查找表( Static Search Table ) :只作查找操作的查找表。
- 动态查找表( Dynamic Search Table ) :在查找过程中同时插入查找表中不存在的数据元素,或者从查找表中删除已经存在的某个数据元素。
顺序查找(Sequential Search)
- 顺序查找又叫线性查找,是从表中第一个(或最后一个)记录开始,逐个进行比较。
/* 无哨兵顺序查找,a为数组,n为要查找的数组个数,key为要查找的关键字 */
int Sequential_Search(int *a,int n,int key)
{
int i;
for(i=1;i<=n;i++)
{
if (a[i]==key)
return i;
}
return 0;
}
/* 有哨兵顺序查找 */
int Sequential_Search2(int *a,int n,int key)
{
int i;
a[0]=key;
i=n;
while(a[i]!=key)
{
i--;
}
return i;
}
- 在查找方向的尽头放置“哨兵”,免去了在查找过程中每一次比较后都要判断查找位置是否越界,看似与原先差别不大,但在总数据较多时,效率提高很大,是非常好的编码技巧。当然,“哨兵”也不一定就一定要在数组开始,也可以在末端。
- 对于这种顺序查找算法来说,
- 查找成功时,最好的情况时间复杂度为 O ( 1 ) ,最坏的情况是需要** n **次比较 , 时间复杂度为 O ( n )。
- 当查找不成功时,需要** n +1 **次比较,时间复杂度为 O ( n )。
- 关键字在任何一位置的概率是相同的,所以平均查找次数为 ( n + 1 ) /2, 所以最终时间复杂度还是O ( n )。
二分(折半)查找
- 折半查找( Binary Search ) 技术,又称为二分查找。它的前提是线性表中的记录必须是关键码有序(通常从小到大有序 ) ,线性表必须采用顺序存储。
- 折半查找的基本思想是:在有序表中,取中间记录作为比较对象,若给定值与中间记录的关键字相等,则查找成功;若给定值小于中间记录的关键字,则在中间记录的左半区继续查找;若给定值大于中间记录的关键字,则在中间记录的右半区继续查找。不断重复上述过程,直到查找成功,或所有查找区域无记录,查找失败为止。
int Binary_Search(int *a,int n,int key) {
int low=0,high=n,mid;
while(low<=high) {
mid=(low+high)/2;
if (key<a[mid]) high=mid-1;
else if (key>a[mid]) low=mid+1;
else return mid;
}
return 0;
}
- " 具有 n 个结点的完全二叉树的深度为 l o g 2 n + 1 { log_2n +1} log2n+1。" 在这里尽管折半查找判定二叉树并不是完全二叉树,但同样相同的推导可以得出 ,最坏情况是查找到关键字或查找失败的次数为 [ l o g 2 n ] + 1 { [ log_2n ] +1} [log2n]+1。最好的情况是 O ( 1 ) 。
- 因此最终我们折半算法的时间复杂度为 O ( l o g 2 n ) { O(log_2n)} O(log2n),它显然远远好于顺序查找的 O ( n )时间复杂度。
索引查找
- 索引按照结构可以分为线性索引、树形索引和多级索引。我们这里就只介绍线性索引技术。所谓线性索引就是将索引项集合组织为线性结构,也称为索引表。三种线性索引:稠密索引、分块索引和倒排索引。
二叉排序树
-
二叉排序树 ( Binary Sort Tree ) ,又称为二叉查找树。它或者是一棵空树,或者是具有下列性质的二叉树。
- 若它的左子树不空 , 则左子树上所有结点的值均小于它的根结构的值 ;
- 若它的右子树不空 , 则右子树上所有结点的值均大干它的根结点的值 ;
-
二叉排序树进行中序遍历时 , 就可以得到一个有序的序列。
-
二叉排序树是以链接的方式存储 , 保持了链接存储结构在执行插入或删除操作时不用移动元素的优点 , 只要找到合适的插入和删除位置后 , 仅需修改链接指针即可,插入删除的时间性能比较好。
-
二叉排序树的查找性能取决于二叉排序树的形状。
- 最好情况下,二叉排序树是比较平衡的 , 即其深度与完全二叉树相同 , 均为 l o g 2 n + 1 { log_2n +1} log2n+1 , 那么查找的时间复杂也就为 O ( l o g 2 n ) { O(log_2n)} O(log2n),近似于折半查找 。
- 不平衡的最坏情况查找时间复杂度为 O( n ) , 等同于顺序查找。
#include "stdio.h"
#include "stdlib.h"
#include "io.h"
#include "math.h"
#include "time.h"
#define OK 1
#define ERROR 0
#define TRUE 1
#define FALSE 0
#define MAXSIZE 100 /* 存储空间初始分配量 */
typedef int Status; /* Status是函数的类型,其值是函数结果状态代码,如OK等 */
/* 二叉树的二叉链表结点结构定义 */
typedef struct BiTNode /* 结点结构 */
{
int data; /* 结点数据 */
struct BiTNode *lchild, *rchild; /* 左右孩子指针 */
} BiTNode, *BiTree;
/* 递归查找二叉排序树T中是否存在key, */
/* 指针f指向T的双亲,其初始调用值为NULL */
/* 若查找成功,则指针p指向该数据元素结点,并返回TRUE */
/* 否则指针p指向查找路径上访问的最后一个结点并返回FALSE */
Status SearchBST(BiTree T, int key, BiTree f, BiTree *p)
{
if (!T) /* 查找不成功 */
{
*p = f;
return FALSE;
}
else if (key==T->data) /* 查找成功 */
{
*p = T;
return TRUE;
}
else if (key<T->data)
return SearchBST(T->lchild, key, T, p); /* 在左子树中继续查找 */
else
return SearchBST(T->rchild, key, T, p); /* 在右子树中继续查找 */
}
/* 当二叉排序树T中不存在关键字等于key的数据元素时, */
/* 插入key并返回TRUE,否则返回FALSE */
Status InsertBST(BiTree *T, int key)
{
BiTree p,s;
if (!SearchBST(*T, key, NULL, &p)) /* 查找不成功 */
{
s = (BiTree)malloc(sizeof(BiTNode));
s->data = key;
s->lchild = s->rchild = NULL;
if (!p)
*T = s; /* 插入s为新的根结点 */
else if (key<p->data)
p->lchild = s; /* 插入s为左孩子 */
else
p->rchild = s; /* 插入s为右孩子 */
return TRUE;
}
else
return FALSE; /* 树中已有关键字相同的结点,不再插入 */
}
/* 从二叉排序树中删除结点p,并重接它的左或右子树。 */
Status Delete(BiTree *p)
{
BiTree q,s;
if((*p)->rchild==NULL) /* 右子树空则只需重接它的左子树(待删结点是叶子也走此分支) */
{
q=*p; *p=(*p)->lchild; free(q);
}
else if((*p)->lchild==NULL) /* 只需重接它的右子树 */
{
q=*p; *p=(*p)->rchild; free(q);
}
else /* 左右子树均不空 */
{
q=*p; s=(*p)->lchild;
while(s->rchild) /* 转左,然后向右到尽头(找待删结点的前驱) */
{
q=s;
s=s->rchild;
}
(*p)->data=s->data; /* s指向被删结点的直接前驱(将被删结点前驱的值取代被删结点的值) */
if(q!=*p)
q->rchild=s->lchild; /* 重接q的右子树 */
else
q->lchild=s->lchild; /* 重接q的左子树 */
free(s);
}
return TRUE;
}
/* 若二叉排序树T中存在关键字等于key的数据元素时,则删除该数据元素结点, */
/* 并返回TRUE;否则返回FALSE。 */
Status DeleteBST(BiTree *T,int key)
{
if(!*T) /* 不存在关键字等于key的数据元素 */
return FALSE;
else
{
if (key==(*T)->data) /* 找到关键字等于key的数据元素 */
return Delete(T);
else if (key<(*T)->data)
return DeleteBST(&(*T)->lchild,key);
else
return DeleteBST(&(*T)->rchild,key);
}
}
int main(void)
{
int i;
int a[10]={62,88,58,47,35,73,51,99,37,93};
BiTree T=NULL;
for(i=0;i<10;i++)
{
InsertBST(&T, a[i]);
}
DeleteBST(&T,93);
DeleteBST(&T,47);
printf("本样例建议断点跟踪查看二叉排序树结构");
return 0;
}
平衡二叉树(AVL树)
- 平衡二叉树( Self - Balancing Binary Search Tree 或 eight - Balanced Binary Search Tree ) , 是一种二叉排序树 , 其中每一个节点的左子树和右子树的高度差至多等于 1。
- 我们将二叉树上结点的左子树深度减去右子树深度的值称为平衡因子 BF (BalanceFactor ) , 那么平衡二叉树上所有结点的平衡因子只可能是 -1 、 0 和 1。只要二叉树上有一个结点的平衡因子的绝对值大于 1 , 则该二叉树就是不平衡的。