哈希表(Hash table)(1)

  哈希表(Hash table)经常被用来做字典(dictionary),或称符号表(symbol-table)

直接存取表(Direct-access table):
• 直接存取表(Direct-access table)的基本思想是:如果key的范围为0~m-1而且所有key都不相同, 那么可以设计一个数组T[0..m-1],让T[k]存放key为k的元素, 否则为空(NIL)
• 显然, 所有操作都是O(1)的
• 问题:key的范围可能很大! 64位整数有18,446,744,073,709,551,616种可能, 而字符串的种类将会更多!

解决方案:哈希函数

• 严格均匀分布的哈希函数很难寻找, 但一般说来有三种方法在实际使用中效果不错
– 取余法:取h(k) = k mod m
– 乘积法:取h(k) = (A*k mod 2w ) rsh(w-r)
– 点积法:随机向量a和k的m进制向量做点积
• 实践中经常采用取余法

冲突(collision):
• 不同的key映射到同一个数, 称为冲突(collision),冲突的两个元素显然不可能放在
哈希表的同一个位置
• 通常有两种冲突解决方案(resolvingcollisions)
– 链方法(chaining):把key相同的串成链表
– 开放地址法(open addressing):自己的位置被占了, 就去占别人的
1)链地址法
• Key相同的元素形成一个链表

链地址法的查找效率
• 链地址法的时间效率取决于hash函数的分布. 我们假设每个k将等可能的被映射到任意一个slot,不管其他key被映射到什么地方
• 设n为key的数目, m为不同的slot数, 装载因子α= n/m,即每个slot平均的key数, 则

2)开放地址法:
• 开发地址法只使用表内的空间. 如果冲突产生, 计算出第二个可能的位置, 如果那里也有其他元素,再看第三个可能的位置… 即按一个探测序列查找
• 位置应该是key和探测的次数(probe number)的函数, 第i次探测位置为slot = h(k,i)
• 每个slot都应能被探测到, 因此每个k的探测序列h(k,0), h(k,1), h(k,2), …,h(k,m-1)
• 都应是{0,1,…,m-1}的排列
• 注意:开放地址法不容易删除元素

探测方法
• 线性探测:
• 虽然很简单, 但是容易形成元素堆积
• 二次哈希:组合两个哈希函数
• 一般效果会好很多,但应保证h 2 (k)和m互素, 比如取m为2的幂而让h 2 (k)只产生奇数
装载因子α<1时, 不成功查找的期望探测次数为1/ (1-α),证略。

在实际应用中,推荐使用链地址法
– first[i]表示哈希函数值为i的第一个数据下标
– key[i]和next[i]表示第i个数据的key和下一个

链地址法:

listNode* find(intk){
  int h = hash(k);
  listNode* p = first[h];
  while (p){ if(p->value == k) return p; p = p->next; }
  return 0;
}
void insert(int x){
  listNode* newNode = new listNode(x);
  int h = hash(key[x]); 
  newNode->next = first[h]; 
  first[h] = newNode;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

One2zeror

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值