HashMap 和hashTable区别

最新推荐文章于 2023-06-07 21:22:28 发布

Kevinniec

最新推荐文章于 2023-06-07 21:22:28 发布

阅读量129

点赞数

分类专栏： Java web异常

本文链接：https://blog.csdn.net/qq_34494334/article/details/79653068

版权

Java web异常专栏收录该内容

8 篇文章 0 订阅

订阅专栏

对外的接口（API）

两个类的继承体系有些不同。虽然都实现了Map、Cloneable、Serializable三个接口。但是HashMap继承自抽象类AbstractMap，而HashTable继承自抽象类Dictionary。其中Dictionary类是一个已经被废弃的类，所有两者的功能一样，都提供键值映射的服务，可以增、删、查、改键值对，可以对建、值、键值对提供遍历视图。支持浅拷贝，支持序列化。

Null Key & Null Value

HashMap是支持null键和null值的，而HashTable在遇到null时，会抛出NullPointerException异常。这并不是因为HashTable有什么特殊的实现层面的原因导致不能支持null键和null值，这仅仅是因为HashMap在实现时对null做了特殊处理，将null的hashCode值定为了0，从而将其存放在哈希表的第0个bucket中。我们一put方法为例，看一看代码的细节：

数据结构

HashMap和HashTable都使用哈希表来存储键值对。在数据结构上是基本相同的，都创建了一个继承自Map.Entry的私有的内部类Entry，每一个Entry对象表示存储在哈希表中的一个键值对。

4.2 算法

上一小节已经说了用来表示哈希表的内部数据结构。HashMap/HashTable还需要有算法来将给定的键key，映射到确定的hash桶（数组位置）。需要有算法在哈希桶内的键值对多到一定程度时，扩充哈希表的大小（数组的大小）。本小节比较这两个类在算法层面有哪些不同。

初始容量大小和每次扩充容量大小的不同。先看代码：

 
        以下代码及注释来自java.util.HashTable 
       
        // 哈希表默认初始大小为11 
       
        public 
        Hashtable() { 
       
        this 
        ( 
        11 
        ,  
        0 
        .75f); 
       
        } 
       
        protected 
        void 
        rehash() { 
       
        int 
        oldCapacity = table.length; 
       
        Entry<K,V>[] oldMap = table; 
       
        // 每次扩容为原来的2n+1 
       
        int 
        newCapacity = (oldCapacity <<  
        1 
        ) +  
        1 
        ; 
       
        // ... 
       
        } 
       
        以下代码及注释来自java.util.HashMap 
       
        // 哈希表默认初始大小为2^4=16 
       
        static 
        final 
        int 
        DEFAULT_INITIAL_CAPACITY =  
        1 
        <<  
        4 
        ;  
        // aka 16 
       
        void 
        addEntry( 
        int 
        hash, K key, V value,  
        int 
        bucketIndex) { 
       
        // 每次扩充为原来的2n  
       
        if 
        ((size >= threshold) && ( 
        null 
        != table[bucketIndex])) { 
       
        resize( 
        2 
        * table.length); 
       
        }

可以看到HashTable默认的初始大小为11，之后每次扩充为原来的2n+1。HashMap默认的初始化大小为16，之后每次扩充为原来的2倍。还有我没列出代码的一点，就是如果在创建时给定了初始化大小，那么HashTable会直接使用你给定的大小，而HashMap会将其扩充为2的幂次方大小。

也就是说HashTable会尽量使用素数、奇数。而HashMap则总是使用2的幂作为哈希表的大小。我们知道当哈希表的大小为素数时，简单的取模哈希的结果会更加均匀（具体证明，见这篇文章），所以单从这一点上看，HashTable的哈希表大小选择，似乎更高明些。但另一方面我们又知道，在取模计算时，如果模数是2的幂，那么我们可以直接使用位运算来得到结果，效率要大大高于做除法。所以从hash计算的效率上，又是HashMap更胜一筹。

所以，事实就是HashMap为了加快hash的速度，将哈希表的大小固定为了2的幂。当然这引入了哈希分布不均匀的问题，所以HashMap为解决这问题，又对hash算法做了一些改动。具体我们来看看，在获取了key对象的hashCode之后，HashTable和HashMap分别是怎样将他们hash到确定的哈希桶（Entry数组位置）中的。

 
        以下代码及注释来自java.util.HashTable 
       
        // hash 不能超过Integer.MAX_VALUE 所以要取其最小的31个bit 
       
        int 
        hash = hash(key); 
       
        int 
        index = (hash &  
        0x7FFFFFFF 
        ) % tab.length; 
       
        // 直接计算key.hashCode() 
       
        private 
        int 
        hash(Object k) { 
       
        // hashSeed will be zero if alternative hashing is disabled. 
       
        return 
        hashSeed ^ k.hashCode(); 
       
        } 
       
        以下代码及注释来自java.util.HashMap 
       
        int 
        hash = hash(key); 
       
        int 
        i = indexFor(hash, table.length); 
       
        // 在计算了key.hashCode()之后，做了一些位运算来减少哈希冲突 
       
        final 
        int 
        hash(Object k) { 
       
        int 
        h = hashSeed; 
       
        if 
        ( 
        0 
        != h && k  
        instanceof 
        String) { 
       
        return 
        sun.misc.Hashing.stringHash32((String) k); 
       
        } 
       
        h ^= k.hashCode(); 
       
        // This function ensures that hashCodes that differ only by 
       
        // constant multiples at each bit position have a bounded 
       
        // number of collisions (approximately 8 at default load factor). 
       
        h ^= (h >>>  
        20 
        ) ^ (h >>>  
        12 
        ); 
       
        return 
        h ^ (h >>>  
        7 
        ) ^ (h >>>  
        4 
        ); 
       
        } 
       
        // 取模不再需要做除法 
       
        static 
        int 
        indexFor( 
        int 
        h,  
        int 
        length) { 
       
        // assert Integer.bitCount(length) == 1 : "length must be a non-zero power of 2"; 
       
        return 
        h & (length- 
        1 
        ); 
       
        }

正如我们所言，HashMap由于使用了2的幂次方，所以在取模运算时不需要做除法，只需要位的与运算就可以了。但是由于引入的hash冲突加剧问题，HashMap在调用了对象的hashCode方法之后，又做了一些位运算在打散数据。关于这些位计算为什么可以打散数据的问题，本文不再展开了。感兴趣的可以看这里。

如果你有细心读代码，还可以发现一点，就是HashMap和HashTable在计算hash时都用到了一个叫hashSeed的变量。这是因为映射到同一个hash桶内的Entry对象，是以链表的形式存在的，而链表的查询效率比较低，所以HashMap/HashTable的效率对哈希冲突非常敏感，所以可以额外开启一个可选hash（hashSeed），从而减少哈希冲突。因为这是两个类相同的一点，所以本文不再展开了，感兴趣的看这里。事实上，这个优化在JDK 1.8中已经去掉了，因为JDK 1.8中，映射到同一个哈希桶（数组位置）的Entry对象，使用了红黑树来存储，从而大大加速了其查找效率。

HashMap大小默认为16，如果给定初始化大小N,其大小为2^N，在扩容时每次是前面大小的两倍。目的是：在运算时不做除法，使用位运算，提高计算效率。

线程安全

HashMap不安全，HashTable安全

简单来说就是，如果你不需要线程安全，那么使用HashMap，如果需要线程安全，那么使用ConcurrentHashMap。HashTable已经被淘汰了，不要在新的代码中再使用它

散列表（Hash table，也叫哈希表），是根据关键码值(Key value)而直接进行访问的数据结构。也就是说，它通过把关键码值映射到表中一个位置来访问记录，以加快查找的速度。这个映射函数叫做散列函数，存放记录的数组叫做散列表。

给定表M，存在函数f(key)，对任意给定的关键字值key，代入函数后若能得到包含该关键字的记录在表中的地址，则称表M为哈希(Hash）表，函数f(key)为哈希(Hash) 函数。

详情：点击打开链接

Kevinniec

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
HashMap 和hashTable区别

对外的接口（API）两个类的继承体系有些不同。虽然都实现了Map、Cloneable、Serializable三个接口。但是HashMap继承自抽象类AbstractMap，而HashTable继承自抽象类Dictionary。其中Dictionary类是一个已经被废弃的类，所有两者的功能一样，都提供键值映射的服务，可以增、删、查、改键值对，可以对建、值、键值对提供遍历视图。支持浅拷贝，支持序列化...
复制链接

扫一扫

专栏目录