哈希表的概念
哈希表(Hash Table)也叫散列表,是根据关键码值(Key, Value)而直接进行访问的数据结构。它通过把关键码值映射到哈希表中的一个位置来访问记录,以加快查找的速度。这个映射函数就做散列函数,存放记录的数组叫做散列表。
散列存储的基本思路
以数据中每个元素的关键字K为自变量,通过散列函数H(k)计算出函数值,以该函数值作为一块连续存储空间的的单元地址,将该元素存储到函数值对应的单元中。
哈希表查找的时间复杂度
哈希表存储的是键值对,其查找的时间复杂度与元素数量多少无关,哈希表在查找元素时是通过计算哈希码值来定位元素的位置从而直接访问元素的,因此,哈希表查找的时间复杂度为O(1),是一种以空间换取时间的做法。
哈希函数的构造方法
哈希表处理冲突主要有开放寻址法、再散列法、链地址法(拉链法)和建立一个公共溢出区四种方法。
本文着重讲解链地址法,这种方法的基本思想是将所有哈希地址为i的元素构成一个称为同义词链的单链表,并将单链表的头指针存在哈希表的第i个单元中,因而查找、插入和删除主要在同义词链中进行。若选定的散列表长度为m,则可将散列表定义为一个由m个头指针组成的指针数组T[0..m-1]。凡是散列地址为i的结点,均插入到以T[i]为头指针的单链表中。T中各分量的初值均应为空指针。链地址法适用于经常进行插入和删除的情况。
链地址法的优点
与开放定址法相比,拉链法有如下几个优点:
(1)拉链法处理冲突简单,且无堆积现象,即非同义词决不会发生冲突,因此平均查找长度较短;
(2)由于拉链法中各链表上的结点空间是动态申请的,故它更适合于造表前无法确定表长的情况;
(3)开放定址法为减少冲突,要求装填因子α较小,故当结点规模较大时会浪费很多空间。而拉链法中可取α≥1,且结点较大时,拉链法中增加的指针域可忽略不计,因此节省空间;
(4)在用拉链法构造的散列表中,删除结点的操作易于实现。只要简单地删去链表上相应的结点即可。而对开放地址法构造的散列表,删除结点不能简单地将被删结点的空间置为空,否则将截断在它之后填入散列表的同义词结点的查找路径。这是因为各种开放地址法中,空地址单元(即开放地址)都是查找失败的条件。 因此在用开放地址法处理冲突的散列表上执行删除操作,只能在被删结点上做删除标记,而不能真正删除结点。
链地址法的缺点
拉链法的缺点是:指针需要额外的空间,故当结点规模较小时,开放定址法较为节省空间,而若将节省的指针空间用来扩大散列表的规模,可使装填因子变小,这又减少了开放定址法中的冲突,从而提高平均查找速度。
代码实现:
// 链地址法实现HashTable
#include <stdio.h>
#include <stdlib.h>
#define HashSize 100
typedef int DataType;
struct ListNode
{
DataType elem;
ListNode* next;
};
struct HashTable
{
int TableSize;
ListNode** LinkList;
};
HashTable* initializeTable(int TableSize);//初始化哈希表
void destoryTable(HashTable* H);//销毁哈希表
unsigned int hash(const char *key, int TableSize);//哈希函数
unsigned int hash(int key, int TableSize);//哈喜函数
ListNode* find(DataType key, HashTable* H);//查找元素
void insert(DataType key, HashTable* H);//插入元素
void del(DataType key, HashTable* H);//删除元素
HashTable* initializeTable(int TableSize)
{
int i;
HashTable* pHashTable;
if(TableSize <= 0)
return NULL;
pHashTable = (HashTable*)malloc(sizeof(HashTable));
if(NULL == pHashTable)
printf("malloc failed!\n");
pHashTable->TableSize = TableSize;
pHashTable->LinkList = (ListNode**)malloc(sizeof(ListNode*)*pHashTable->TableSize);
if(NULL == pHashTable->LinkList)
printf("malloc LinkList failed!\n");
for(i=0;i<pHashTable->TableSize;i++)
{
pHashTable->LinkList[i] = (ListNode*)malloc(sizeof(ListNode));
if(NULL == pHashTable->LinkList[i])
printf("malloc ListNode failed!\n");
else
pHashTable->LinkList[i]->next = NULL;
}
return pHashTable;
}
/*
unsigned int hash(const char *key, int TableSize)
{
unsigned hashVal = 0;
while (*key != '\0')
hashVal = (hashVal << 5) + *key++;
return hashVal % TableSize;
}
*/
unsigned int hash(int key, int TableSize)
{
return (key % TableSize);
}
void destoryTable(HashTable* H)
{
if(NULL == H)
return;
int i;
for(i=0;i<H->TableSize;i++)
{
free(H->LinkList[i]);
H->LinkList[i] = NULL;
}
free(H->LinkList);
H->LinkList = NULL;
}
ListNode* find(DataType key, HashTable* H)
{
ListNode *node, *list;
unsigned int hashVal = hash(key,H->TableSize); //get the hash value
list = H->LinkList[hashVal];
node = list->next;
while(node != NULL && node->elem != key) //if DataType is char*, need strcmp()
node = node->next;
return node; //if not found ,return NULL
}
void insert(DataType key, HashTable* H)
{
ListNode *NewNode, *pos;
ListNode *list;
pos = find(key, H);
if(NULL == pos)// 如果哈希表中不存在该元素,则插入该元素
{
NewNode = (ListNode*)malloc(sizeof(ListNode));
if(NULL == NewNode)
printf("malloc new ListNode failed!\n");
else
{
list = H->LinkList[hash(key, H->TableSize)];//插在该位置之后
NewNode->next = list->next;
NewNode->elem = key;
list->next = NewNode;
}
}
else //否则什么也不做
return;
}
void del(DataType key, HashTable* H)
{
if(NULL == H)
return;
unsigned int hashVal = hash(key, H->TableSize);//get the hash value
ListNode *prev, *pos;
pos = find(key, H);
if(pos == NULL)
{
printf("There is no %d in HashTable!\n", key);
return;
}
prev = H->LinkList[ hashVal ];
while(prev->next != NULL && prev->next != pos) //找到当前节点的上一个节点
prev = prev->next;
prev->next = pos->next;
free(pos); //释放要删除的节点
pos = NULL;
}
int main()
{
int arr[] = {1,3,45,6,20,27,87,5,11,99};
int len = 10;
HashTable *hashtable = initializeTable(HashSize);
for(int i=0;i<len;i++)
insert(arr[i], hashtable);
ListNode *listnode = find(87, hashtable);
if(NULL == listnode)
printf("not found\n");
else
printf("yes,found\n");
//printf("---%d\n",(-45%100));
del(45, hashtable);
ListNode *listnode1 = find(45, hashtable);
if(NULL == listnode1)
printf("not found\n");
else
printf("yes,found\n");
getchar();
return 0;
}
如有问题,欢迎指正。