hash_map是经常被使用的一种数据结构,而其实现方式也是多种多样。如果要求我们使用尽可能简单的方式实现hash_map,具体该如何做呢?
我们知道hash_map最重要两个概念是hash函数和冲突解决算法。hash_map键-值之间的映射关系,hash函数将键映射为内存地址,冲突解决算法用于解决不同的键映射为相同地址时候的情况。
数据结构和算法导论中介绍了大量的hash函数和冲突解决算法,如果选择实现精简的hash_map,那么可以选择“除留取余法”作为hash函数,选择“开散列地址链”作为冲入解决算法。这样的选择不仅使得hash_map实现简单,而且有很高的查询效率。其设计结构如下:
基于地址链的开散列哈希表实现
如图所示,键347通过除留取余法得到地址链的索引,然后将347对应的元素插入到该地址链的尾端。
为了实现地址链,我们需要定义链表节点类型Node。为了简化问题,我们将键值都定义为int类型。
struct Node
//
地址链节点
{
int key; // 键
int value; // 值
Node*next; // 链接指针
Node( int k, int v):key(k),value(v),next(NULL){}
};
{
int key; // 键
int value; // 值
Node*next; // 链接指针
Node( int k, int v):key(k),value(v),next(NULL){}
};
value用于记录节点数组,key在检索节点时会被使用,next保存链表关系。
基于此,定义hash_map类型SimHash。
#define SIZE 100
//
地址链个数,足够大
class SimHash
{
Node**map; // 地址链数组
size_t hash( int key) // hash函数,除留取余法
{
return key%SIZE;
}
public:
SimHash()
{
map= new Node*[SIZE];
for(size_t i= 0;i<SIZE;i++)map[i]=NULL; // 初始化数组为空
}
~SimHash()
{
for(size_t i= 0;i<SIZE;i++) // 清除所有节点
{
Node*p;
while(p=map[i])
{
map[i]=p->next;
delete p;
}
}
delete[] map; // 清除数组
}
void insert( int key, int value)
{
Node*f=find(key); // 插入前查询
if(f)
{
f->value=value; // 存在键则覆盖
return;
}
Node*p=map[hash(key)]; // 确定地址链索引
Node*q= new Node(key,value);
class SimHash
{
Node**map; // 地址链数组
size_t hash( int key) // hash函数,除留取余法
{
return key%SIZE;
}
public:
SimHash()
{
map= new Node*[SIZE];
for(size_t i= 0;i<SIZE;i++)map[i]=NULL; // 初始化数组为空
}
~SimHash()
{
for(size_t i= 0;i<SIZE;i++) // 清除所有节点
{
Node*p;
while(p=map[i])
{
map[i]=p->next;
delete p;
}
}
delete[] map; // 清除数组
}
void insert( int key, int value)
{
Node*f=find(key); // 插入前查询
if(f)
{
f->value=value; // 存在键则覆盖
return;
}
Node*p=map[hash(key)]; // 确定地址链索引
Node*q= new Node(key,value);