查找概论
查找表(Search Table) 是由同一类型的数据元素(或记录)构成的集合。
关键字(Key)是数据元素中某个数据项的值,又称为键值。 用它可以标识一个数据元素,也可以标识一个记录的某个数据项,称之为关键码。
若此关键字可以唯一的标识记录,则称此关键字为主关键字(Primary Key);
对于那些可以识别为多个数据元素的关键字,称之为次关键字(Secondary Key);
查找:就是根据给定的某个值,在查找表中确定一个其关键字等于给定值的数据元素(或记录)。
按照查找表的操作方式可以分为两大种类,静态查找表和动态查找表
静态查找表(Static Search Table): 只作查找操作的查找表:
1)查找某个”特定的“数据元素是否在查找表中;
2)检索某个”特定的“数据元素和各种属性。
动态查找表(Dynamic Search Table):在查找过程中同时插入查找表中不存在的数据元素,或者从查找表中删除已经存在的某个元素。
1)查找时插入数据元素
2)查找时删除数据元素
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
顺序表查找
顺序表查找(Sequential Search)又叫线性查找,其查找过程是:从表中第一个(最后个)记录开始,逐个进行记录的关键字和给定值进行比较,若某个记录的关键字和给定值相等,则查找成功,找到查找记录;如果直到最后一个(或第一个)记录,其关键字和给定值比较都不等时,则表中没有所查的记录,查找不成功。
// 顺序查找,a为数组,n为要查找的数组个数,key为要查找的关键字
int Sequential_Search(int *a, int n, int key)
{
int i;
for( i = 0; i<n ; i++)
{
if(a[i] == key)
return i;
}
return 0;
}
优化算法
上算法每次循环的时候都需要对i进行判定越界,即是否小于n做判断。事实上,可以通过设置哨兵来解决这种现象。
// 带哨兵的查找算法
int Sequential_Search2(int *a, int n, int key)
{
int i;
a[n] = key; //设置a[n]/a[0]为关键字,称之为哨兵
i = 0; //循环从头开始
while( a[i]!= key)
{
i++;
}
return i; //返回n则说明查找失败
}
此时,代码从头开始查找,由于a[n] = key, 也就是说,如果在a[i]中有key,则返回i的值,查找成功。否则,一定在最终的a[n]处等于key, 此时返回的是0,即 a[0] ~ a[n-1]中没有关键字,查找失败。
这种查找方式在尽头设置”哨兵”免去了在查找过程中每次比较后都要进行判断位置是否越界的小技巧,看似与原先区别不大,但是总数较多时,效率提示会有很大。
以上两个查找算法的时间复杂度为O(n)。
有序表查找
二分查找算法&插值查找
折半查找(Binary Search)技术,又称为二分查找。他的前提是在线性表中的记录必须是关键码有序(通常从小到大),线性表必须采用顺序存储。
折半查找的基本思想是:
在有序表中,取中间记录作为比较对象,若给定值与中间记录的关键字相等,查找成功;若给定值小于中间记录关键字,则在中间记录的左半区继续查找;若定值大于中间记录的关键字,则在中间记录的右半区继续查找。不断重复上面的步骤,直到查找成功为止。
时间复杂度O(logn)
假设有序数组={1,16,24,35,44,49,59,68,78,79,88,99}
int Binary_Search(int* a, int n, int key)
{
int low,high,mid;
low = 0; // 最低下标,首位
high = n-1; // 最高下标,末位
while(low <= high)
{
mid = (low+high) / 2; //折半
// 插值 mid = low + (high - low)*(key-a[low])/(a[high]-a[low])
if(key < a[mid]) //比查找值小
high = mid - 1; // 最高下标调整到中位下标的下一位
else if(key > a[mid]) //比查找值大,调整到中位下标大一位
low = mid +1;
else
return mid; //相等,返回中间位置
}
return -1;
}
插值查找:是根据要查找的关键字key与查找表中最大最小记录的关键字比较后的查找方法,其核心就在于插值计算公式。 (key - a[low])/(a[high] - a[low])
斐波那契查找
// 斐波那契查找
// 首先需要有现成的斐波那契数列数组F[]
// 斐波那契查找核心在于
// 1),当key = a[mid]时,查找成功
// 2),当key < a[mid]时,新的范围是第low个到第mid-1个,此时范围个数为F[k-1]-1个。
// 3),当key > a[mid]时,新范围是m+1个到第high个,此时范围个数为F[k-2]-1个。
F = {0,1,1,2,3,5,8,13,21,...}
int Fibonacci_Search(int *a, int n, int key)
{
int low, high, mid, i, k;
low = 0; //定义最低下标为记录首位
high = n-1; //定义最高下标为记录末位
k = 0; //斐波那契数列索引
while(n > F[k]-1) //查找N位于斐波那契数列的位置
k++;
for(i = n; i<F[k]-1; i++) //将不满的数值补全
a[i] = a[n-1];
while( low <= high )
{
mid = low + F[k-1] - 1; //计算当前分割的下标
if(key < a[mid]) //若查找记录小于当前分割记录
{
high = mid-1; //最高下标调整到分割下标mid-1处
k = k-1; //斐波那契数列下标减一
}
else if(key > a[mid]) //若查找记录大于当前分割记录
{
low = mid+1; //最低下标调整到分割下标mid+1处
k = 2; //斐波那契数列下标减两位
}
else
{
if(mid <= n) //若相等则说明mid即为查找到的位置
return mid;
else
return n; //若mid>n说明是补全的数组,则为n
}
}
return 0;
}