hash算法实现-(java-hashmap)

原创 2012年03月22日 16:32:13
Hash又叫散列,输入任意长度的字节,通过哈希算法,转换成固定长度的哈希值;

哈希列表的实现是通过对key进行哈希,得到的哈希值来做为存储数据的数组的索引,这样会有一个问题是不同的key的哈希值有可能会重复,所以我们在数组存储位上创建一个链表来存储相同哈希值的数据

在java中就是通过引用,数组,链表来实现的hashmap

我们先看hashmap中存放数据的结构:

static class Entry<K,V> implements Map.Entry<K,V> {  
       final K key;  
        V value;  
        final int hash;  
        Entry<K,V> next;  
...........  
} 


 

每个Entry会有一个指向下一个数据的引用,这就在同一个槽位上构成了链表,最先加入的放在链表头部,后加入的放在尾部。

很显然只有当我们能够均匀的将hash值分布在数组的所有槽位上的时候,这个时候我们对链表操作是最少的,效率是最高的。

基本的hash寻址算法有除法散列法平方散列法斐波那契(Fibonacci)散列法等,但是java是这样做的:

 static int indexFor(int h, int length) {
        return h & (length-1);
    }


 

java会用key的hashcode值与数组的槽数-1进行与运算

这里会有一个问题只有当数组的槽数为2的n次方-1,其二进制全是1的(如2的2次方-1=11)的时候哈希值产生碰撞的概率是最小的

所以在java中hashmap的数组的初始大小是16(2的4次方)

 

hashmap的resize:

当不断put数据使数据慢慢变大的时候,刚开始的数组已经不能满足需求了,我们需要扩大数组的槽数

hashmap中有loadFactor属性,该属性默认为0.75,即元素个数达到数组的百分之七十五的时候,数组槽数会进行翻倍,并且之前已存入的数据会重新进行计算。

 

so:如果我们可以预估我们会在hashmap中存放1000个数据,那么我们就要确保数组的槽数乘上0.75大于1000,我们得到1366,如果我们这样写new HashMap(1366),java会自动帮我们转换成new HashMap(2048)(2的n次方)

 

版权声明:本文为博主原创文章,未经博主允许不得转载。

相关文章推荐

Java HashMap的hash算法

HashMap 中hash table 定位算法:  Java代码   int hash = hash(key.hashCode());   int i = ind...
  • matt8
  • matt8
  • 2016-08-25 10:22
  • 228

hash算法 (hashmap 实现原理)

Hash ,一般翻译做“ 散列” ,也有直接音译为“ 哈希” 的,就是把任意长度的输入(又叫做预映射, pre-image),通过散列算法,变换成固定长度的输出,该输出就是散列值。这种转换是一种压缩映...

hash算法(hashmap实现原理)

Hash,一般翻译做“散列”,也有直接音译为“哈希”的,就是把任意长度的输入(又叫做预映射, pre-image),通过散列算法,变换成固定长度的输出,该输出就是散列值。这种转换是一种压缩映射,也就是...
  • wy819
  • wy819
  • 2016-05-10 15:34
  • 84

hash算法 (hashmap 实现原理)

转载 Hash ,一般翻译做“ 散列” ,也有直接音译为“ 哈希” 的,就是把任意长度的输入(又叫做预映射, pre-image ),通过散列算法,变换成固定长度的输出,该输出就是散列值。这种转换...

hash算法 (hashmap 实现原理)

Hash ,一般翻译做“ 散列” ,也有直接音译为“ 哈希” 的,就是把任意长度的输入(又叫做预映射, pre-image),通过散列算法,变换成固定长度的输出,该输出就是散列值。这种转换是一种压缩映...

hash算法 (hashmap 实现原理)

source: http://zha-zi.iteye.com/blog/1124484      Hash ,一般翻译做“ 散列” ,也有直接音译为“ 哈希” 的,就是把任意长度的...

hash算法 (hashmap 实现原理)

Hash ,一般翻译做“ 散列” ,也有直接音译为“ 哈希” 的,就是把任意长度的输入(又叫做预映射, pre-image),通过散列算法,变换成固定长度的输出,该输出就是散列值。这种转换是一种压缩映...

对一致性Hash算法,Java代码实现的深入研究

一致性Hash算法 关于一致性Hash算法,在我之前的博文中已经有多次提到了,MemCache超详细解读一文中"一致性Hash算法"部分,对于为什么要使用一致性Hash算法、一致性Hash算法的...

Hash算法大全(java实现)

Hash算法有很多很多种类。具体的可以参考之前我写的Hash算法的一些分析。本处给大家提供一个集合了很多使用的Hash算法的类,应该可以满足不少人的需要的: Java代码   /** ...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)