java源码分析之HashMap（jdk1.6）

最新推荐文章于 2023-04-04 17:40:00 发布

xubing716

最新推荐文章于 2023-04-04 17:40:00 发布

阅读量448

点赞数 1

分类专栏： java集合框架文章标签： java 数据结构

本文链接：https://blog.csdn.net/xubing716/article/details/50012453

版权

java集合框架专栏收录该内容

4 篇文章 0 订阅

订阅专栏

java源码分析之HashMap（jdk1.6）

我是java新手，刚刚学习不久，有不足之处请大家谅解，同时请大家多多指教
学习hashMap之前，我复习了下数据结构中的hash表，解决hash冲突采用的拉链法，如下图所示：
这里写图片描述
源码：
1.HashMap继承自AbstractMap，实现了Map接口（这些内容可以参考《Java集合类》）。来看类的定义。

public class HashMap<K,V>extends AbstractMap<K,V>
        implements Map<K,V>, Cloneable, Serializable

Map接口定义了所有Map子类必须实现的方法。Map接口中还定义了一个内部接口Entry。（Entry将在后面有详细的介绍）
AbstractMap也实现了Map接口，并且提供了两个实现Entry的内部类：SimpleEntry和SimpleImmutableEntry
HashMap中定义的属性：

    /*
      初始容量，必须为2的幂次方
    */
    static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; 
    /*
     定义最大的容量，
    */
    static final int MAXIMUM_CAPACITY = 1 << 30;
    /**
      装载因子，后面会有介绍
    */
    static final float DEFAULT_LOAD_FACTOR = 0.75f;
    /*
      定义一个默认的存储Entry对象的数组
    */
    static final Entry<?,?>[] EMPTY_TABLE = {};
    /*
      初始化，table
    */
    transient Entry<K,V>[] table = (Entry<K,V>[]) EMPTY_TABLE;
    /*
      存储键值对的个数
    */
    transient int size;
    /**
      极限值，当size大于这个值的时候，需要进行增容的操作
      等于容量乘以装载因子
    */
    int threshold;
    /*
      装载因子，我们可以进行改变的
    */
    final float loadFactor;
    /**
     修改的次数，可以用来在迭代器中判断操作是否同步
    */
    transient int modCount;

下面再来看下构造函数：

    /**
     *使用默认的容量及装载因子构造一个空的HashMap
     */
    public HashMap() {
        //初始化装载因子，采用默认大小
        this.loadFactor = DEFAULT_LOAD_FACTOR;
        threshold = (int)(DEFAULT_INITIAL_CAPACITY * DEFAULT_LOAD_FACTOR);//计算下次需要调整大小的极限值
        table = new Entry[DEFAULT_INITIAL_CAPACITY];//根据默认容量（16）初始化table
        //这里是一个空函数，不知道用来做什么，可能方便以后的扩展
        init();  
    }
   /**
     * 根据给定的初始容量的装载因子创建一个空的HashMap
     * 初始容量小于0或装载因子小于等于0将报异常 
     */
    public HashMap(int initialCapacity, float loadFactor) {
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal initial         capacity: " + nitialCapacity);
            //调整最大容量
        if (initialCapacity > MAXIMUM_CAPACITY)
            initialCapacity = MAXIMUM_CAPACITY;
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal load factor: " +loadFactor);
        int capacity = 1;
        //设置capacity为大于initialCapacity且是2的幂的最小值
        while (capacity < initialCapacity)
            capacity <<= 1;
        this.loadFactor = loadFactor;
        //设置极限值，
        threshold = (int)(capacity * loadFactor);
        table = new Entry[capacity];
        init();
    }
   /**
     *根据指定容量创建一个空的HashMap
     */
    public HashMap(int initialCapacity) {
        //调用上面的构造方法，容量为指定的容量，装载因子是默认值
        this(initialCapacity, DEFAULT_LOAD_FACTOR); 
    }
    /**
     *通过传入的map创建一个HashMap，容量为默认容量（16）和(map.zise()/DEFAULT_LOAD_FACTORY)+1的较大者，装载因子为默认值
     */
    public HashMap(Map<? extends K, ? extends V> m) {
        this(Math.max((int) (m.size() / DEFAULT_LOAD_FACTOR) + 1,DEFAULT_INITIAL_CAPACITY), DEFAULT_LOAD_FACTOR);
        //putAllForCreate看方法名就是创建的时候将传入的map全部放入新创建的对象中。该方法中还涉及到其他方法，将在后面介绍
       putAllForCreate(m);
    }

先看初始化table时均使用了Entry，这是HashMap的一个内部类，实现了Map接口的内部接口Entry，下面看下在HashMap内部中定义的内部类：

static class Entry<K,V> implements Map.Entry<K,V> {
        final K key;
        V value;
        Entry<K,V> next;//在上面图上，可以知道：解决hash冲突的方式为：拉链法，即链表，这里为下一个节点的引用
        final int hash;//哈希值
        Entry(int h, K k, V v, Entry<K,V> n) {
            value = v;
            next = n;
            key = k;
            hash = h;
        }
        public final K getKey() {
            return key;
        }
        public final V getValue() {
            return value;
        }
        public final V setValue(V newValue) {
            V oldValue = value;
            value = newValue;
            return oldValue;
        }
        //在hashMap中判断key唯一性，需用用到equals这个方法，还一个方法为hashCode
        public final boolean equals(Object o) {
            //先判断类型是否一致
            if (!(o instanceof Map.Entry))
                return false;
            Map.Entry e = (Map.Entry)o;
            Object k1 = getKey();
            Object k2 = e.getKey();
            // Key相等且Value相等则两个Entry相等，则不需要插入
            if (k1 == k2 || (k1 != null && k1.equals(k2))) {
                Object v1 = getValue();
                Object v2 = e.getValue();
                if (v1 == v2 || (v1 != null && v1.equals(v2)))
                    return true;
            }
            return false;
        }
        // hashCode是Key的hashCode和Value的hashCode的异或的结果
        public final int hashCode() {
            return (key==null   ? 0 : key.hashCode()) ^
                   (value==null ? 0 : value.hashCode());
        }
        // 重写toString方法，是输出更清晰
        public final String toString() {
            return getKey() + "=" + getValue();
        }
        /**
         *当调用put(k,v)方法存入键值对时，如果k已经存在，则该方法被调用（为什么没有内容？）
         */
        void recordAccess(HashMap<K,V> m) {
        }
        /**
         * 当Entry被从HashMap中移除时被调用（为什么没有内容？）
         */
        void recordRemoval(HashMap<K,V> m) {
        }
    }

分析HashMap中的其他方法，从最常用的put和get开始看起：

 public V put(K key, V value) {
        // key可以分为：null和非空两种情况
        if (key == null)
        //采用添加key为空的方法
            return putForNullKey(value);
        //计算hash值
        int hash = hash(key.hashCode());
        //计算hash值在数组中映射的下标
        int i = indexFor(hash, table.length);
        //查找是否有hash相等和key相等节点，有的话，进行节点值得更新
        for (Entry<K,V> e = table[i]; e != null; e = e.next) {
            Object k;
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
                return oldValue;
            }
        }
        modCount++;  //修改次数
        //实现添加，再添加的时候，需要判断是否需要增容的操作
        addEntry(hash, key, value, i);
        return null;
    }

当存入的key是null的时候将调用putForNUllKey方法，暂时将这段逻辑放一边，看key不为null的情况。先调用了hash(int h)方法获取了一个hash值。

/*
   这个方法的主要作用是防止质量较差的哈希函数带来过多的冲突（碰撞）问题。Java中int值占4个字节，即32位。根据这32位值进行移位、异或运算得到一个值
*/
 static int hash(int h) {
        h ^= (h >>> 20) ^ (h >>> 12);
        return h ^ (h >>> 7) ^ (h >>> 4);
    }

获取下标的方法：

//根据hash值映射到数组中的下标，采用位运算，速度快
static int indexFor(int h, int length) {
   return h & (length-1); 
  }

实现添加节点：

void addEntry(int hash, K key, V value, int bucketIndex) {
     //获取数组中下标为bucketIndex处的节点，采用头插法，实现节点的插入
     Entry<K,V> e = table[bucketIndex];
      table[bucketIndex] = new Entry<K,V>(hash, key, value, e);
      //判断是否需要增容的操作，需要扩大2倍
        if (size++ >= threshold)
             resize(2 * table.length);
     }

增容：

void resize(int newCapacity) {
        Entry[] oldTable = table;
        int oldCapacity = oldTable.length;
        // 这个if块表明，如果容量已经到达允许的最大值，即MAXIMUN_CAPACITY，则不再拓展容量，而将装载拓展的界限值设为计算机允许的最大值。
        // 不会再触发resize方法，而是不断的向map中添加内容，即table数组中的链表可以不断变长，但数组长度不再改变
        if (oldCapacity == MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return;
        }
        // 创建新数组，容量为指定的容量
        Entry[] newTable = new Entry[newCapacity];
        transfer(newTable);
        table = newTable;
        // 设置下一次需要调整数组大小的界限
        threshold = (int)(newCapacity * loadFactor);
    }

实现整体节点的复制：到新的容器中去

void transfer(Entry[] newTable) {
        // 保留原数组的引用到src中，
        Entry[] src = table;
        // 新容量使新数组的长度
        int newCapacity = newTable.length;
        // 遍历原数组
        for (int j = 0; j < src.length; j++) {
            // 获取元素e
            Entry<K,V> e = src[j];
            if (e != null) {
                // 将原数组中的元素置为null
                src[j] = null;
                // 遍历原数组中j位置指向的链表
                do {
                    Entry<K,V> next = e.next;
                    // 根据新的容量计算e在新数组中的位置
                    int i = indexFor(e.hash, newCapacity);
                    // 采用头插法
                    e.next = newTable[i];
                    newTable[i] = e;
                    e = next;
                } while (e != null);
            }
        }
    }

从上面的代码可以看出，HashMap之所以不能保持元素的顺序有以下几点原因：第一，插入元素的时候对元素进行哈希处理，不同元素分配到table的不同位置；第二，容量拓展的时候又进行了hash处理；第三，复制原表内容的时候链表被倒置。

下面介绍下：put的所有方法

  public void putAll(Map<? extends K, ? extends V> m) {
        int numKeysToBeAdded = m.size();
        if (numKeysToBeAdded == 0)
            return;
        /*
          为什么判断条件是numKeysToBeAdded，不是两者之和了？
          查了下资料：可能是为了避免有相同元素
        */
        if (numKeysToBeAdded > threshold) {
            int targetCapacity = (int)(numKeysToBeAdded / loadFactor + 1);
            if (targetCapacity > MAXIMUM_CAPACITY)
                targetCapacity = MAXIMUM_CAPACITY;
            int newCapacity = table.length;
            //记住：容量一定为2的幂次方
            while (newCapacity < targetCapacity)
                newCapacity <<= 1;
            if (newCapacity > table.length)
                resize(newCapacity);
        }
        //再利用迭代器，实现元素的插入
        for (Iterator<? extends Map.Entry<? extends K, ? extends V>> i = m.entrySet().iterator(); i.hasNext(); ) {
            Map.Entry<? extends K, ? extends V> e = i.next();
            put(e.getKey(), e.getValue());
        }
    }

上面出现了entrySet方法，它是返回是一个迭代器，在后面会介绍，本质就是一个代理类，继续介绍put方法

//实现把一个key为null节点添加，计算hash值得时候，可以看到：key为null的时候，hash值就是0，映射到数组的下标也是0
private V putForNullKey(V value) {
        //查找key是否已经存在
        for (Entry<K,V> e = table[0]; e != null; e = e.next) {
            if (e.key == null) {
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
                return oldValue;
            }
        }
        modCount++;
        //不存在的话，实现添加
        addEntry(0, null, value, 0);
        return null;
    }

/*
  还记得这个方式是在：构造函数中，里面一个map结合来初始化的时候，出现过:
  思路就是：迭代一个元素，就添加一个元素到新的容器中去
*/
private void putAllForCreate(Map<? extends K, ? extends V> m) {
         for (Iterator<? extends Map.Entry<? extends K, ?    extends V>> i = m.entrySet().iterator(); i.hasNext(); ) {
            Map.Entry<? extends K, ? extends V> e = i.next();
           putForCreate(e.getKey(), e.getValue());
       }
   }

//基本思想和：addEntry一样
1.key是否为null  2。查找key是否已经存在，  3。不存在添加，存在修改value
private void putForCreate(K key, V value) {
        int hash = (key == null) ? 0 : hash(key.hashCode());
        int i = indexFor(hash, table.length);
        for (Entry<K,V> e = table[i]; e != null; e = e.next) {
            Object k;
            if (e.hash == hash &&
                ((k = e.key) == key || (key != null && key.equals(k)))) {
                e.value = value;
                return;
            }
        }
        //添加元素
        createEntry(hash, key, value, i);
    }

void createEntry(int hash, K key, V value, int bucketIndex) {
    Entry<K,V> e = table[bucketIndex];
      table[bucketIndex] = new Entry<K,V>(hash, key, value, e);
      size++;
     }

上面已经把put方法介绍完了，下面开始介绍get方法

/**
  思路：
      1。获取的key是否为null ，为null =====进行 getForNullKey()
      2 不为空，根据hash，找到在数组中的下标
      3.查找数组中指定下标处的链表，进行判断hash和key，找到返回value，没有找到返回null
*/
public V get(Object key) {
        if (key == null)
            return getForNullKey();
        int hash = hash(key.hashCode());
        for (Entry<K,V> e = table[indexFor(hash, table.length)];
             e != null;
             e = e.next) {
            Object k;
            if (e.hash == hash && ((k = e.key) == key || key.equals(k)))
                return e.value;
        }
        return null;
    }

private V getForNullKey() {
        for (Entry<K,V> e = table[0]; e != null; e = e.next) {
            if (e.key == null)
                return e.value;
        }
        return null;
    }

上面把put和get方法都看完了，下面看下其他的方法：
HashMap没有提供判断元素是否存在的方法，只提供了判断Key是否存在及Value是否存在的方法，分别是
1）containsKey(Object key)
2）containsValue(Object value)
containsKey(Object key)方法很简单，只是判断getEntry(key)的结果是否为null，是则返回false，否返回true。

public boolean containsKey(Object key) {
        return getEntry(key) != null;
    }
final Entry<K,V> getEntry(Object key) {
        int hash = (key == null) ? 0 : hash(key.hashCode());
        for (Entry<K,V> e = table[indexFor(hash, table.length)];
             e != null;
             e = e.next) {
            Object k;
            if (e.hash == hash &&
                ((k = e.key) == key || (key != null && key.equals(k))))
                return e;
        }
        return null;
    }

/**
  分为：value为空和非空的情况
  遍历所有节点：找到相关key的value相比较
  经过双重循环，比较耗时，效率不高
*/
public boolean containsValue(Object value) {
    if (value == null)
            return containsNullValue();

    Entry[] tab = table;
        for (int i = 0; i < tab.length ; i++)
            for (Entry e = tab[i] ; e != null ; e = e.next)
                if (value.equals(e.value))
                    return true;
    return false;
    }
private boolean containsNullValue() {
    Entry[] tab = table;
        for (int i = 0; i < tab.length ; i++)
            for (Entry e = tab[i] ; e != null ; e = e.next)
                if (e.value == null)
                    return true;
    return false;
    }

接着看HashMap中“删除”相关的操作，有remove(Object key)和clear()两个方法

/**
思路： 分为key为null和非空的情况
1。不为空的情况，根据hash找到在数组中的映射下标，找到给链表的头结点
2。找到该节点，需要判断的是，删除的节点是否为头结点
3。删除节点
4。没有找到，返回null
*/
 final Entry<K,V> removeEntryForKey(Object key) {
        int hash = (key == null) ? 0 : hash(key.hashCode());
        int i = indexFor(hash, table.length);
        Entry<K,V> prev = table[i];
        Entry<K,V> e = prev;

        while (e != null) {
            Entry<K,V> next = e.next;
            Object k;
            if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) {
                modCount++;
                size--;
                //判断是否为头结点
                if (prev == e)
                    table[i] = next;  //直接指向后面节点复制
                else
                    prev.next = next;
                e.recordRemoval(this);
                return e;
            }
            prev = e;
            e = next;
        }

        return e;
    }

/**
直接将table数组内容都置空，这样所有的链表都已经无法访问，Java的垃圾回收机制会去处理这些链表。table数组置空后修改size为0。
*/
public void clear() {
        modCount++;
        /**
         这里有个问题，不直接对table进行操作，而是通过其他变量来操作
         我的理解是：直接对table操作的话，可能会改变table引用的对象
        */
        Entry[] tab = table;
        for (int i = 0; i < tab.length; i++)
            tab[i] = null;
        size = 0;
    }

下面看HashMap中的entrySet（） keySet（）和Values（）方法
相同点：它们都是通过代理类实现的：

public Set<Map.Entry<K,V>> entrySet() {
    return entrySet0();
    }

    private Set<Map.Entry<K,V>> entrySet0() {
        Set<Map.Entry<K,V>> es = entrySet;
        //返回的是一个：EntrySet内部类对象，基本操作都是调用HashMap内部的迭代器进行操作的
        return es != null ? es : (entrySet = new EntrySet());
    }

private final class EntrySet extendsAbstractSet<Map.Entry<K,V>> {
        /**
        返回迭代器
        */
        public Iterator<Map.Entry<K,V>> iterator() {
            return newEntryIterator();
        }
        //直接调用HashMap中的方法，判断是否包含这个节点对象
        public boolean contains(Object o) {
            if (!(o instanceof Map.Entry))
                return false;
            Map.Entry<K,V> e = (Map.Entry<K,V>) o;
            Entry<K,V> candidate = getEntry(e.getKey());
            return candidate != null && candidate.equals(e);
        }
        //直接调用HashMap中删除方法
        public boolean remove(Object o) {
            return removeMapping(o) != null;
        }
        //返回数据的个数
        public int size() {
            return size;
       //直接调用HashMap中方法
        public void clear() {
            HashMap.this.clear();
        }
    }

看到了什么？这个类根本就没属性，它只是个代理。因为它内部类，可以访问外部类的内容，debug的时候能看到的属性都是继承或者外部类的属性，输出的时候其实也是调用到了父类的toString方法将HashMap中的内容输出了。看newEntryIterator()这个迭代器：

 Iterator<Map.Entry<K,V>> newEntryIterator()   {
        return new EntryIterator();
    }

//继承HashMap中的迭代器，
 private final class EntryIterator extends HashIterator<Map.Entry<K,V>> {
        public Map.Entry<K,V> next() {
            //调用HashIterator迭代器中的方法
            return nextEntry();
        }
    }

下面看下HashIterator迭代类：

private abstract class HashIterator<E> implements Iterator<E> {
        Entry<K,V> next;        // next entry to return
        int expectedModCount;   // For fast-fail
        int index;              // current slot
        Entry<K,V> current;     // current entry

        HashIterator() {
            expectedModCount = modCount;
            if (size > 0) { 
                Entry[] t = table;
       /*
       这个方法：
          1。next为数组中index处的链表下个节点的引用
          2。当给节点为null时，获取数组中下一个index，（即下一个链表的头结点）
       */
       while (index < t.length && (next = t[index++]) == null)
                    ;
            }
        }
        //是否有下个元素
        public final boolean hasNext() {
            return next != null;
        }
        //获取下一个元素
        final Entry<K,V> nextEntry() {
            if (modCount != expectedModCount)
                throw new ConcurrentModificationException();
            Entry<K,V> e = next;
            if (e == null)
                throw new NoSuchElementException();
            if ((next = e.next) == null) {
                Entry[] t = table;
        while (index < t.length && (next = t[index++]) == null)
                    ;
            }
            current = e;
            return e;
        }
        //删除，调用的是HashMap中的方法
        public void remove() {
            if (current == null)
                throw new IllegalStateException();
            if (modCount != expectedModCount)
                throw new ConcurrentModificationException();
            Object k = current.key;
            current = null;
            HashMap.this.removeEntryForKey(k);
            expectedModCount = modCount;
        }
    }

keySet()

public Set<K> keySet() {
        Set<K> ks = keySet;
        return (ks != null ? ks : (keySet = new KeySet()));
    }

    private final class KeySet extends AbstractSet<K> {
        public Iterator<K> iterator() {
            return newKeyIterator();
        }
        public int size() {
            return size;
        }
        public boolean contains(Object o) {
            return containsKey(o);
        }
        public boolean remove(Object o) {
            return HashMap.this.removeEntryForKey(o) != null;
        }
        public void clear() {
            HashMap.this.clear();
        }
    }

    Iterator<K> newKeyIterator()   {
        return new KeyIterator();
    }

    private final class KeyIterator extends HashIterator<K> {
        public K next() {
        //直接调用hashmap中迭代器
            return nextEntry().getKey();
        }
    }

上面keySet是不是和entrySet方法相似，是的，他们都是一个代理类，具体的都是调用hashmap中的迭代器进行操作的，继续看下：

values()

public Collection values() {
Collection vs = values;
return (vs != null ? vs : (values = new Values()));
}

private final class Values extends AbstractCollection<V> {
    public Iterator<V> iterator() {
        return newValueIterator();
    }
    public int size() {
        return size;
    }
    public boolean contains(Object o) {
        return containsValue(o);
    }
    public void clear() {
        HashMap.this.clear();
    }
}

public Collection<V> values() {
        Collection<V> vs = values;
        return (vs != null ? vs : (values = new Values()));
    }

    private final class Values extends AbstractCollection<V> {
        public Iterator<V> iterator() {
            return newValueIterator();
        }
        public int size() {
            return size;
        }
        public boolean contains(Object o) {
            return containsValue(o);
        }
        public void clear() {
            HashMap.this.clear();
        }
    }
   Iterator<V> newValueIterator()   {
        return new ValueIterator();
    }
  private final class ValueIterator extends HashIterator<V> {
        public V next() {
            return nextEntry().value;
        }
    }