/*
*Copyright (c) 2015 , 烟台大学计算机学院
*All right resvered .
*文件名称:分块查找.cpp
*作 者: 郑兆涵
*查找——索引结构和分块查找
*/
问题实现分块查找,并分析相关代码
编程代码:
//分块查找函数实现
#include <stdio.h>
#define MAXL 100 //数据表的最大长度
#define MAXI 20 //索引表的最大长度
typedef int KeyType;
typedef char InfoType[10];
typedef struct
{
KeyType key; //KeyType为关键字的数据类型
InfoType data; //其他数据
} NodeType;
typedef NodeType SeqList[MAXL]; //顺序表类型
typedef struct
{
KeyType key; //KeyType为关键字的类型
int link; //指向对应块的起始下标
} IdxType;
typedef IdxType IDX[MAXI]; //索引表类型
int IdxSearch(IDX I,int m,SeqList R,int n,KeyType k)
{
int low=0,high=m-1,mid,i;
int b=n/m; //b为每块的记录个数
while (low<=high) //在索引表中进行二分查找,找到的位置存放在low中
{
mid=(low+high)/2;
if (I[mid].key>=k)
high=mid-1;
else
low=mid+1;
}
//应在索引表的high+1块中,再在线性表中进行顺序查找
i=I[high+1].link;
while (i<=I[high+1].link+b-1 && R[i].key!=k) i++;
if (i<=I[high+1].link+b-1)
return i+1;
else
return 0;
}
int main()
{
int i,n=25,m=5,j;
SeqList R;
IDX I= {{14,0},{34,5},{66,10},{85,15},{100,20}};
KeyType a[]= {8,14,6,9,10,22,34,18,19,31,40,38,54,66,46,71,78,68,80,85,100,94,88,96,87};
KeyType x=85;
for (i=0; i<n; i++)
R[i].key=a[i];
j=IdxSearch(I,m,R,n,x);
if (j!=0)
printf("%d是第%d个数据\n",x,j);
else
printf("未找到%d\n",x);
return 0;
}
输出结果:
学习心得:
(1)索引存储结构:
索引存储结构是在存储数据的同时,还建立附加的索引表。索引表中的每一项称为索引项,索引项的一般形式为:(关键字,地址)
关键字唯一标识一个节点,地址是指向该关键字对应节点的指针,也可以是相对地址。在索引存储结构中进行关键字查找时,可以先在索引表中快速查找(因为索引表中按关键字有序排列,可以采用折半查找)到相应的关键字,然后通过地址找到节点表中对应的节点。线性结构采用索引存储后,可以对节点进行随机访问。在进行插入、删除运算时,由于只需要修改索引表中相关节点的存储地址,而不必一定存储在节点表中的节点,所以仍可以保持较高的运算效率。
索引存储结构的缺点是:建立索引表而因此增加时间和空间的开销。
(2)分块查找:
分块查找又称索引顺序查找,它是一种性能介于顺序查找和折半查找之间的查找方法。它要求按如下的索引方式存储线性表:将R[0..n-1]均分为b块,前b-1块中元素个数为s=[n/b],最后一块即第b块的元素个数小于等于s;每一块中的关键字不一定有序,但前一块的最大关键字必须小于后一块中的最小关键字,即要求是“分块有序”的;抽取各块的最大关键字及起始位置构成一个索引表IDX[0..b-1],即IDX[i](0≤i≤b-1)中存放着第i块的最大关键字及该块在表R中的起始位置。由于表R是分块有序的,所以索引表示一个递增有序表。
分块查找的基本思路是:首先查找索引表,因为索引表示有序表,故可采用折半查找或顺序查找,以确定待查的元素在哪一块;然后在已确定的块中进行顺序查找(因块内元素无序,只能用顺序查找)。
分块查找的主要代价是增加一个索引表的存储空间和延长建立索引表的时间。