查找方法有顺序查找、折半查找、分块查找、Hash表查找等等。
哈希查找的思想接原理
Hash表的含义
Hash表,又称散列表。在前面讨论的顺序、折半、分块查找和树表的查找中,其ASL的量级在O(n)~O(log2n)之间。不论ASL在哪个量级,都与记录长度n有关。随着n的扩大,算法的效率会越来越低。ASL与n有关是因为记录在存储器中的存放是随机的,或者说记录的key与记录的存放地址无关,因而查找只能建立在key的“比较”基础上。
理想的查找方法是:对给定的k,不经任何比较便能获取所需的记录,其查找的时间复杂度为常数级O(C)。这就要求在建立记录表的时候,确定记录的key与其存储地址之间的关系f,即使key与记录的存放地址H相对应:
Hash表的原理
对于数组来说获取成员的方式很简单直接通过下标即可完成,但是数组在编译的时候已经决定了大小。
链表虽然没有成员个数的限制,但是查找的时候挨个比较效率比较低。所以Hash就结合了两者的优点。
既保证了内存的占用,有保证了查找的效率。数组的大小的获取方式是拿数组成员的个数除以0.75。在
得到的结果取取出最大的质数作为数组的下标。做种做法尽可能的解决掉了hash冲突的问题。
eg:
数n=11。令装填因子α=0.75,取表长m= n/α =14.6。从0-14.6中取最大的质数用13.
“保留余数法”选取Hash函数(p=13):
n={23,34,14,38,46,16,68,15,07,31,26}
代码实现
hash.h
#ifndef __HASH_H__
#define __HASH_H__
#include <stdio.h>
#include <stdlib.h>
#define TS 13 //hash中数组成员的个数13 0-12
#define N 11 //数据的个数
#define datatype int
typedef struct node{
datatype data; //节点的数据
struct node *next; //指向下一个节点的指针
}hash_t;
hash_t **HashTableCreate(void);
int HashTableInsertValue(hash_t **t,datatype data);
void HashTableShow(hash_t **t);
int HashTableSearch(hash_t **t,datatype data);
#endif
hash.c
#include "hash.h"
hash_t** HashTableCreate(void)
{
hash_t** t;
if ((t = (hash_t**)malloc(TS * sizeof(hash_t*))) == NULL) {
printf("malloc memory error\n");
return NULL;
}
//循环分配链表头的内存
for (int i = 0; i < TS; i++) {
t[i] = malloc(sizeof(hash_t));
if (t[i] == NULL) {
printf("malloc memory error\n");
return NULL;
}
t[i]->data = (datatype)0;
t[i]->next = NULL;
}
return t;
}
int HashTableInsertValue(hash_t** t, datatype data)
{
hash_t* tmp;
// 1.分配节点内存
if ((tmp = (hash_t*)malloc(sizeof(*tmp))) == NULL) {
printf("malloc memory error\n");
return -1;
}
tmp->data = data;
// 2.将tmp插入到Hash表中
tmp->next = t[data % TS]->next;
t[data % TS]->next = tmp;
return 0;
}
void HashLinkShow(hash_t *h)
{
while(h!=NULL){
printf("-%d",h->data);
h = h->next;
}
puts("");
}
void HashTableShow(hash_t **t)
{
for(int i=0;i<TS;i++){
printf("T[%d]",i);
HashLinkShow(t[i]->next);
}
}
int HashTableSearchPosByData(hash_t* h, datatype data)
{
int pos = 0;
while (h->next != NULL) {
if (h->next->data == data) {
return pos;
}
h = h->next;
pos++;
}
// printf("输入的数据不存在,查询失败\n");
return -1;
}
int HashTableSearch(hash_t **t,datatype data)
{
return HashTableSearchPosByData(t[data%TS],data);
}
main.c
#include "hash.h"
int main(int argc,const char * argv[])
{
hash_t **t;
int pos;
int arr[N]={23,34,14,38,46,16,68,15,07,31,26};
//1.创建hash表
t = HashTableCreate();
if(t==NULL){
printf("hash table create error\n");
return -1;
}
//2.将数据插入到hash表中
for(int i=0;i<N;i++){
HashTableInsertValue(t,arr[i]);
}
//3.显示hash表中的数据
HashTableShow(t);
//4.hash查找
if((pos = HashTableSearch(t,31))!=-1){
printf("查询的数据存在T[%d],pos:%d\n",31%TS,pos);
}else{
printf("在哈希表中查找的数据不存在\n");
}
return 0;
}
上述代码执行效果