一、查找的基本概念
- 列表:由同一类型的数据元素组成的集合。
- 关键码:数据元素中的某个数据项,可以标识列表中的一个或一组数据元素。
- 键值:关键码的值。
- 主关键码:可以唯一地标识一个记录的关键码。
- 次关键码:不能唯一地标识一个记录的关键码。
- 查找 :在具有相同类型的记录构成的集合中找出满足给定条件的记录。
- 查找的结果 :若在查找集合中找到了与给定值相匹配的记录,则称查找成功;否则,称查找失败。
- 静态查找 :不涉及插入和删除操作的查找 。
- 动态查找 :涉及插入和删除操作的查找。
- 查找结构 :面向查找操作的数据结构 ,即查找基于的数据结构。
平均查找长度:将查找算法进行的关键码的比较次数的数学期望值定义为平均查找长度。计算公式为:
n:问题规模,查找集合中的记录个数;
pi:查找第i个记录的概率;
ci:查找第i个记录所需的关键码的比较次数。
二.查找方式
1.顺序查找:
int SeqSearch1(int r[ ], int n, int k)//数组r[1] ~ r[n]存放查找集合
{
i=n;
while (i>0 && r[i]!=k)
i--;
return i;
}
改进的顺序查找
基本思想:设置“哨兵”。
哨兵就是待查值,将哨兵放在查找方向的尽头处,免去了在查找过程中每一次比较后都要判断查找位置是否越界,从而提高查找速度。
int SeqSearch2(int r[ ], int n, int k) //数组r[1] ~ r[n]存放查找集合
{
r[0]=k; i=n;
while (r[i]!=k)
i --;
return i;
}
单链表的顺序查找:
int LinkSearch::SeqSearch2(Node *first, int k)
{
Node *p;
int count=0;///记录比较的次数
p=first->next;
int j=1;///记录数据在表中的位置
while (p && p->data != k)
{
p=p->next;
j++;
count++;
}
if (!p)
{
cout<<"查找失败,比较的次数为:"<<count<<endl;
return 0;
}
else
{
cout<<"\n"<<"查找成功,比较的次数为:"<<count<<endl;
return j;
}
}
2.折半查找
适用条件:
- 线性表中的记录必须按关键码有序;
- 必须采用顺序存储。
基本思想:
在有序表中,取中间记录作为比较对象,若给定值与中间记录的关键码相等,则查找成功;若给定值小于中间记录的关键码,则在中间记录的左半区继续查找;若给定值大于中间记录的关键码,则在中间记录的右半区继续查找。不断重复上述过程,直到查找成功,或所查找的区域无记录,查找失败。
非递归算法:
int BinSearch1(int r[ ], int n, int k)
{
int low=1;
high=n,mid;
while (low<=high)
{
mid=(low+high)/2;
if (k<r[mid])
high=mid-1;
else if (k>r[mid])
low=mid+1;
else
return mid;
}
return 0;
}
递归算法
int BinSearch2(int r[ ], int low, int high, int k)
{
if (low>high)
return 0;
else
{
mid=(low+high)/2;
if (k<r[mid])
return BinSearch2(r, low, mid-1, k);
else if (k>r[mid])
return BinSearch2(r, mid+1, high, k);
else
return mid;
}
}
3.折半查找判定树
判定树:折半查找的过程可以用二叉树来描述,树中的每个结点对应有序表中的一个记录,结点的值为该记录在表中的位置。通常称这个描述折半查找过程的二叉树为折半查找判定树,简称判定树。
判定树的构造方法
⑴ 当n=0时,折半查找判定树为空;
⑵ 当n>0时,
折半查找判定树的根结点为mid=(n+1)/2,
根结点的左子树是与有序表r[1] ~ r[mid-1]相对应的折半查找判定树,
根结点的右子树是与r[mid+1] ~ r[n]相对应的折半查找判定树。
判定树的特点
任意两棵折半查找判定树,若它们的结点个数相同,则它们的结构完全相同
具有n个结点的折半查找树的高度为
判定树的性质
任意结点的左右子树中结点个数最多相差1
任意结点的左右子树的高度最多相差1
任意两个叶子所处的层次最多相差1
查找成功时的平均查找长度ASL:
失败情况下的平均查找长度等于树的高度