HashMap详解

最新推荐文章于 2020-12-25 19:46:26 发布

niclascage

最新推荐文章于 2020-12-25 19:46:26 发布

阅读量447

点赞数

分类专栏： Java基础文章标签： java hashmap hashCode 哈希码

Java基础专栏收录该内容

11 篇文章

订阅专栏

引子

HashMap可以说是Java中最常用的集合类框架之一，是Java语言中非常典型的数据结构。

了解HashMap之前，我们需要知道Object类的两个方法hashCode和equals。hashCode和equals的相关知识可以参考hashCode和equals

了解了hashCode和equals之后，我们来看看HashMap。HashMap是最常用的集合类框架之一，它实现了Map接口，所以存储的元素也是键值对映射的结构，并允许使用null值和null键，其内元素是无序的，如果要保证有序，可以使用LinkedHashMap。HashMap是线程不安全的。

HashMap

HashMap 结构

HashMap继承java.util.AbstractMap继承java.util.HashMap

所有已实现的接口：
Serializable,Cloneable,Map

HashMap中我们最长用的就是put(K, V)和get(K)。我们都知道，HashMap的K值是唯一的，那如何保证唯一性呢？我们首先想到的是用equals比较，没错，这样可以实现，但随着内部元素的增多，put和get的效率将越来越低，这里的时间复杂度是O(n)，假如有1000个元素，put时需要比较1000次。实际上，HashMap很少会用到equals方法，因为其内通过一个哈希表管理所有元素，哈希是通过hash单词音译过来的，也可以称为散列表，哈希算法可以快速的存取元素，当我们调用put存值时，HashMap首先会调用K的hashCode方法，获取哈希码，通过哈希码快速找到某个存放位置，这个位置可以被称之为bucketIndex，通过上面所述hashCode的协定可以知道，如果hashCode不同，equals一定为false，如果hashCode相同，equals不一定为true。所以理论上，hashCode可能存在冲突的情况，有个专业名词叫碰撞，当碰撞发生时，计算出的bucketIndex也是相同的，这时会取到bucketIndex位置已存储的元素，最终通过equals来比较，equals方法就是哈希码碰撞时才会执行的方法，所以前面说HashMap很少会用到equals。HashMap通过hashCode和equals最终判断出K是否已存在，如果已存在，则使用新V值替换旧V值，并返回旧V值，如果不存在，则存放新的键值对到bucketIndex位置。文字描述有些乱，通过下面的流程图来梳理一下整个put过程。
这里写图片描述
现在我们知道，执行put方法后，最终HashMap的存储结构会有这三种情况，情形3是最少发生的，哈希码发生碰撞属于小概率事件。到目前为止，我们了解了两件事：

HashMap通过键的hashCode来快速的存取元素。
当不同的对象hashCode发生碰撞时，HashMap通过单链表来解决，将新元素加入链表表头，通过next指向原有的元素。单链表在Java中的实现就是对象的引用(复合)。

附：第三种情况采用链式表存储结构，优点是添加和删除元素快。get的时候先通过key的hashcode运算出存放的位置bucketIndex，然后从链头遍历到链尾，调用key的equals方法进行比较。

来鉴赏一下HashMap中put方法源码：

public V put(K key, V value) {  
    // 处理key为null，HashMap允许key和value为null  
    if (key == null)  
        return putForNullKey(value);  
    // 得到key的哈希码  
    int hash = hash(key);  
    // 通过哈希码计算出bucketIndex  
    int i = indexFor(hash, table.length);  
    // 取出bucketIndex位置上的元素，并循环单链表，判断key是否已存在  
    for (Entry<K,V> e = table[i]; e != null; e = e.next) {  
        Object k;  
        // 哈希码相同并且对象相同时  
        if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {  
            // 新值替换旧值，并返回旧值  
            V oldValue = e.value;  
            e.value = value;  
            e.recordAccess(this);  
            return oldValue;  
        }  
    }  

    // key不存在时，加入新元素  
    modCount++;  
    addEntry(hash, key, value, i);  
    return null;  
}

get方法源码

public Object get(Object obj){
    if(obj == null){//如果K为空的情况
        return getForNullKey();
    } else{//K不为null时
        Entry entry = getEntry(obj);
        return null != entry ? entry.getValue() : null;
    }
}

//K为空时
private Object getForNullKey(){
    for(Entry entry = table[0]; entry != null; entry = entry.next)
    if(entry.key == null)
        return entry.value;
    return null;
}

//K不为空时获取Entry
final Entry getEntry(Object obj){
    //得到可的hash值
    int i = obj != null ? hash(obj) : 0;
    //循环bucketIndex中的元素
    for(Entry entry = table[indexFor(i, table.length)]; entry != null; entry = entry.next){
        Object obj1;
        //如果参数K的hash值与bucketIndex中某个元素的hash值相等且（它们的地址相等或者equals为true），则返回此元素
        if(entry.hash == i && ((obj1 = entry.key) == obj || obj != null && obj.equals(obj1)))
        return entry;
    }
    return null;
}