1.基本思想
分块查找,也叫索引顺序查找,算法实现除了需要查找表本身之外,还需要根据查找表建立一个索引表。例如
上图中,待查找表中共 18 个查找关键字,将其平均分为 3 个子表,对每个子表建立一个索引,索引中包含中两部分内容:
该子表部分中最大的关键字以及第一个关键字在总表中的位置,即该子表的起始位置。
建立的索引表要求按照关键字进行升序排序,查找表要么整体有序,要么分块有序。
分块有序指的是子表中所有关键字都要大于前一个子表中的最大关键字,小于后一个子表中的最小关键字
块(子表)中各关键字的具体顺序,根据各自可能会被查找到的概率而定。如果各关键字被查找到的概率是相等的,那么可以随机存放;否则可按照被查找概率进行降序排序,以提高算法运行效率。
分块查找算法的运行效率受两部分影响:查找块的操作和块内查找的操作。
-
查找块的操作可以采用顺序查找,也可以采用折半查找(更优)
-
块内查找的操作采用顺序查找的方式。
总体来说,分块查找算法的效率是顺序查找和折半查找的结合体
2.算法步骤
分块查找的过程分为两步进行:
- 确定要查找的关键字可能存在的具体块(子表)(对索引表中的最大关键字进行查找)
- 在具体的块中进行顺序查找。
提示:在第一步确定块(子表)时,由于索引表中按照关键字有序,所有可以采用二分查找算法。而在第二步中,由于各子表中关键字没有严格要求有序,所以只能采用顺序查找的方式。
3.代码实现
3.1.算法实现
int blockSearch(int key, int a[]) {
int i, startValue;
i = 0;
while (i<3 && key>newIndex[i].key) { //确定在哪个块中,遍历每个块,确定key在哪个块中
i++;
}
if (i >= 3) { //大于分得的块数,则返回0
return -1;
}
startValue = newIndex[i].start; //startValue等于块范围的起始值
while (startValue <= startValue + 5 && a[startValue] != key)
{
startValue++;
}
if (startValue > startValue + 5) { //如果大于块范围的结束值,则说明没有要查找的数
return -1;
}
return startValue;
}
3.2.测试程序
#define _CRT_SECURE_NO_WARNINGS//vs使用scanf需要使用宏定义去除警告
#include <stdio.h>
#include <stdlib.h>
struct index { //定义块的结构
int key;
int start;
} newIndex[3]; //定义结构体数组
int blockSearch(int key, int a[]);
int cmp(const void* a, const void* b) {
return (*(struct index*)a).key > (*(struct index*)b).key ? 1 : -1;
}//比较结构体的key值
int main() {
int i, j = -1, k, key;
int a[] = { 33,42,44,38,24,48, 22,12,13,8,9,20, 60,58,74,49,86,53 };//待搜索的数组
//确认模块的起始值和最大值
for (i = 0; i < 3; i++) {
newIndex[i].start = j + 1; //确定每个块范围的起始值
j += 6;
for (int k = newIndex[i].start; k <= j; k++) {
if (newIndex[i].key < a[k]) {
newIndex[i].key = a[k];
}
}
}
//对结构体按照 key 值进行排序
qsort(newIndex, 3, sizeof(newIndex[0]), cmp);
//输入要查询的数,并调用函数进行查找
printf("请输入您想要查找的数:\n");
scanf("%d", &key);
k = blockSearch(key, a);
//输出查找的结果
if (k > 0) {
printf("查找成功!您要找的数在数组中的位置是:%d\n", k + 1);
}
else {
printf("查找失败!您要找的数不在数组中。\n");
}
return 0;
}