散列表

一.要解决的问题

对于一种动态集合结构,它至少要支持INSERT,SEARCH,DELETE字典操作。

现在,有关键字全域集合U,U={0,1,.....,m-1},每个元素都取自该集合中的一个关键字,假设没有元素相同的关键字。

1.直接寻址表

直接寻址表就是一个数组T[0...m-1],其中每个位置对应全域U中的一个关键字.

对于上述方法,有什么缺点了?

1.如果U中有很多的关键字,那么要存储这些关键字要一张很大的表。内存消耗太大。

2.有可能实际存储的KEY集合相对U来说很小,那么分配给数组T的大部分空间资源都将浪费掉.


现在我们使用散列表来解决此问题


二.散列表

之前我们把关键字为k的元素被存放在位置为k的T数组中,而在散列方式中,该元素存放在h(k),即利用散列函数h计算关键字k的位置,函数h将全域U映射到散列表(hash table)T(0,...m-1)的位置上.

上述这个方法存在的一个问题:如果有两个key值得hash值一样,那么就会存在冲突,解决这个冲突有两种方法,一种是链接法解决冲突,另一种是开放寻址法


前面说到,我们是通过hash函数来计算hash值,看下,有哪些hash函数

一般情况下,假定关键字的全域为自然数集N={0,1,2,...}.因此,如果所给的关键字不是自然数,那么就需要一种方法来将它们转换为自然数。例如,一个字符串可以被转化为按适当的基数符号表示的整数。pt可以转换为十进制整数对(112,116)。然后,以128为基数来表示,pt即为(112*128)+116=14452.

1.除法散列法

通过取k除以m的余数,将关键字k映射到m个槽中的某一个上.即散列函数为h(k)= k mod m  

关于m的取值的建议是不太接近2的整数幂的素数。

2.乘法散列法

构造其乘法散列法包含两个步骤,第一步,用关键字K乘上常数A(0<A<1),并提取kA的小数部分,第二步,用m乘以这个值,再向下取整数。

h(k)=[m(kA mod 1)]

3.全域散列法

上述散列法中,不管选择除法散列法,还是乘法散列法,都有可能把n个关键字全部散列到同一个槽中,是的平均检索时间为O(n).

改进方法是随机地选择散列函数,使之独立于要存储的关键字。这种方法叫做全域散列。

三. 冲突解决办法

1.开放寻址法:

开放寻址法有三种解决冲突的方法

1.线性探测法

如果要插入的位置已经被占用,那么数组下表一直递增直到找到空位。

问题:

1.是否允许有重复值

如果有重复值,那么每次查询的时候就要遍历整个序列,这样,性能会很低。

2.聚集产生

当随着数据量的增加,如果有很多的数据产生的hash值相同,那么就会产生聚集现象,并且有可能另一半很稀疏。

例子:散列函数使用除法散列法

/**
 * 节点数据模型
 * @author Administrator
 *
 */
public class DataItem {
	private int key;
	
	private int data;
    
	
	public DataItem(int key, int data) {
		super();
		this.key = key;
		this.data = data;
	}

	public int getKey() {
		return key;
	}

	public void 
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值