面试总结之[HashMap与HashTable区别]

最新推荐文章于 2024-07-23 13:57:12 发布

有糖哥

最新推荐文章于 2024-07-23 13:57:12 发布

阅读量647

点赞数 2

分类专栏：基础篇

本文链接：https://blog.csdn.net/hequan199411/article/details/81736135

版权

基础篇专栏收录该内容

8 篇文章

订阅专栏

本文详细对比了HashMap和HashTable在时间出现、对null的支持、线程安全性、hash值计算方式、内部实现、遍历方式等方面的差异。探讨了两者在不同场景下的优劣，并介绍了创建线程安全Map的三种方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

面试必问的基础题就是HashMap和HashTable的区别,他设计到底层的原理和线程的安全,还有就是HashMap在JDk1.8以后有什么新变化,我自己简单总结了一下;

1:时间

HashTable产生于JDK 1.1，而HashMap产生于JDK 1.2。从时间的维度上来看，HashMap要比HashTable出现得晚一些。

2:Null Key & Null Value

HashMap是支持null键和null值的，而HashTable在遇到null时，会抛出NullPointerException异常。这并不是因为HashTable有什么特殊的实现层面的原因导致不能支持null键和null值，这仅仅是因为HashMap在实现时对null做了特殊处理，将null的hashCode值定为了0，从而将其存放在哈希表的第0个bucket中。在HashMap中不能由get()方法来判断HashMap中是否存在某个键，而应该用containsKey()方法来判断.我们一put方法为例，看一看代码的细节：
以下代码及注释来自java.util.HashTable

public synchronized V put(K key, V value) {

    // 如果value为null，抛出NullPointerException
    if (value == null) {
        throw new NullPointerException();
    }

    // 如果key为null，在调用key.hashCode()时抛出NullPointerException

    // ...
}


以下代码及注释来自java.util.HasMap

public V put(K key, V value) {
    if (table == EMPTY_TABLE) {
        inflateTable(threshold);
    }
    // 当key为null时，调用putForNullKey特殊处理
    if (key == null)
        return putForNullKey(value);
    // ...
}

private V putForNullKey(V value) {
    // key为null时，放到table[0]也就是第0个bucket中
    for (Entry<K,V> e = table[0]; e != null; e = e.next) {
        if (e.key == null) {
            V oldValue = e.value;
            e.value = value;
            e.recordAccess(this);
            return oldValue;
        }
    }
    modCount++;
    addEntry(0, null, value, 0);
    return null;
}

3:线程安全

我们说HashTable是同步的，HashMap不是，也就是说HashTable在多线程使用的情况下，不需要做额外的同步，而HashMap则不行。那么HashTable是怎么做到的呢？

以下代码及注释来自java.util.HashTable

public synchronized V get(Object key) {
    Entry tab[] = table;
    int hash = hash(key);
    int index = (hash & 0x7FFFFFFF) % tab.length;
    for (Entry<K,V> e = tab[index] ; e != null ; e = e.next) {
        if ((e.hash == hash) && e.key.equals(key)) {
            return e.value;
        }
    }
    return null;
}

public Set<K> keySet() {
    if (keySet == null)
        keySet = Collections.synchronizedSet(new KeySet(), this);
    return keySet;
}

4:计算hash值方式：hash值是用来计算存储下标的

Hashtable计算hash是直接使用key的hashcode对table数组的长度直接进行取模;

5:内部实现使用的数组初始化和扩容方式不同

HashTable的初始容量是11，HashMap的初始容量是16.两者的填充因子默认都是0.75。

HashMap扩容时是:当前容量X2。在扩大容量时须要重新计算hash

Hashtable扩容时是:当前容量X2+1。

也就是说HashTable会尽量使用素数、奇数。而HashMap则总是使用2的幂作为哈希表的大小。我们知道当哈希表的大小为素数时，简单的取模哈希的结果会更加均匀（具体证明，见这篇文章），所以单从这一点上看，HashTable的哈希表大小选择，似乎更高明些。但另一方面我们又知道，在取模计算时，如果模数是2的幂，那么我们可以直接使用位运算来得到结果，效率要大大高于做除法。所以从hash计算的效率上，又是HashMap更胜一筹

6:遍历方式不同

HashMap遍历使用的是Iterator迭代器；

HashTable遍历使用的是Enumeration列举；

什么是线程安全，什么是非线程安全？

非线程安全是指多线程操作同一个对象可能会出现问题。而线程安全则是多线程操作同一个对象不会有问题。
线程安全必须要使用很多synchronized关键字来同步控制，所以必然会导致性能的降低。
非线程安全!=不安全

有人在使用过程中有一个不正确的观点：我的程序是多线程的，不能使用ArrayList要使用Vector，这样才安全。

非线程安全并不是多线程环境下就不能使用。注意我上面有说到：多线程操作同一个对象。注意是同一个对象。比如最上面那个模拟，就是在主线程中new的一个ArrayList然后多个线程操作同一个ArrayList对象。

如果是每个线程中new一个ArrayList，而这个ArrayList只在这一个线程中使用，那么肯定是没问题的。

HashMap的底层实现原理

首先有一个每个元素都是链表（可能表述不准确）的数组，当添加一个元素（key-value）时，就首先计算元素key的hash值，以此确定插入数组中的位置，但是可能存在同一hash值的元素已经被放在数组同一位置了，这时就添加到同一hash值的元素的后面，他们在数组的同一位置，但是形成了链表，同一各链表上的Hash值是相同的，所以说数组存放的是链表。而当链表长度太长时，链表就转换为红黑树，这样大大提高了查找的效率。当链表数组的容量超过初始容量的0.75时，再散列将链表数组扩大2倍，把原链表数组的搬移到新的数组中;

如何创建一个线程安全的Map？

第一种方式:
Map<String, String> hashtable = new Hashtable<>();
第二种方式
Map<String, String> synchronizedHashMap = Collections.synchronizedMap(new HashMap<String, String>());
第三种方式
Map<String, String> concurrentHashMap = new ConcurrentHashMap<>();