详细分析jdk1.7的HashMap源码

最新推荐文章于 2024-03-26 20:08:38 发布

Hai-Yang-code

最新推荐文章于 2024-03-26 20:08:38 发布

阅读量566

点赞数

分类专栏：面试专栏文章标签： java

本文链接：https://blog.csdn.net/weixin_45007916/article/details/106823327

版权

面试专栏专栏收录该内容

39 篇文章 1 订阅

订阅专栏

先看一段代码

public static void main(String[] args) {
       Map<String,Object> map=new HashMap<>();
       map.put("key=1","value=100");
       Object put = map.put("key=1", "value=200");
       System.out.println(put);
   }

结果

//value=100

我们知道map中一个key只能对应一个value，我们再put这个key，会把原来的value返回回来。

为什么jdk1.7 HashMap 的实现原理：数组+链表

我们要向一个数组中存入一个值，我们必须知道你要存的下标
jdk是如何实现的呢

    public V put(K key, V value) {
        if (table == EMPTY_TABLE) {
            inflateTable(threshold);
        }
        if (key == null)
            return putForNullKey(value);
        int hash = hash(key);
        int i = indexFor(hash, table.length);
        for (Entry<K,V> e = table[i]; e != null; e = e.next) {
            Object k;
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
                return oldValue;
            }
        }

        modCount++;
        addEntry(hash, key, value, i);
        return null;
    }

可以看到它通过hash（）这个方法计算了一个hash值，再通过indexFor（）这个方法根据hash值和数组长度算出索引值i
在这里插入图片描述
采用链表的结构很大程度上解决了hash冲突问题。
为什么第二个在上面，这是由于jdk1.7 采用了头插的方式，这个下面再叙述

看一下这个indexFor方法

    static int indexFor(int h, int length) {
        // assert Integer.bitCount(length) == 1 : "length must be a non-zero power of 2";
        return h & (length-1);
    }

HashMap的初始容量和扩容都是以2的次方来进行的，那么length-1换算成二进制的话肯定所有位都为1，就比如数组长度为8，2的3次方为8（1000），length-1的二进制表示就是111，而按位与计算的原则是两位同时为“1”，结果才为“1”，否则为“0”。假设计算出来的hash值为135
135（10000111）&7（111）=7，现在，数组下标为7，所以h& (length-1)运算从数值上来讲其实等价于对length取模，也就是h%length。

如果不满足前提条件“HashMap的初始容量和扩容都是以2的次方来进行的”，会发生什么问题呢？

假设当前table的length是15，二进制表示为1111，那么length-1就是1110，此时有两个hash值为8和9的key需要计算索引值，计算过程如下：

//8的二进制表示：1000
//8&（length-1）= 1000 & 1110 = 1000，索引值即为8;

//9的二进制表示：1001
//9&（length-1）= 1001 & 1110 = 1000，索引值也为8;

这样一来就产生了相同的索引值，也就是说两个hash值为8和9的key会定位到数组中的同一个位置上形成链表，这就产生了碰撞
同时，我们也可以发现，当数组长度为15的时候，hash值会与length-1（1110）进行按位与，那么最后一位永远是0，而0001，0011，0101，1001，1011，0111，1101这几个位置永远都不能存放元素了，会造成严重的空间浪费，更糟的是这种情况下，数组可以使用的位置比数组长度小了很多，这意味着进一步增加了碰撞的几率，减慢了查询的效率。
因此可以看出，只有当数组长度为2的n次方时，不同的key计算得出的index索引相同的几率才会较小，数据在数组上分布也比较均匀，碰撞的几率也小，相对的，查询的时候就不用遍历某个位置上的链表，这样查询效率也就较高了。
此外，位运算快于十进制运算，hashmap扩容也是按位扩容，这样同时也提高了运算效

HashMap的构造函数

    static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16 //数组默认的容量为16
    static final int MAXIMUM_CAPACITY = 1 << 30;//最大
    static final float DEFAULT_LOAD_FACTOR = 0.75f;//扩容因子
    static final Entry<?,?>[] EMPTY_TABLE = {};
    transient Entry<K,V>[] table = (Entry<K,V>[]) EMPTY_TABLE;//Entry数组
    transient int size;
    int threshold;//阈值
    final float loadFactor;
    transient int modCount;
    static final int ALTERNATIVE_HASHING_THRESHOLD_DEFAULT = Integer.MAX_VALUE;
	/*
	*initialCapacity传进来的数组容量，loadFactor扩容因子
	*先对这两个值进行合法判断
	*threshold = initialCapacity;把容量赋值给了一个阈值？
	*/
    public HashMap(int initialCapacity, float loadFactor) {
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal initial capacity: " +
                                               initialCapacity);
        if (initialCapacity > MAXIMUM_CAPACITY)
            initialCapacity = MAXIMUM_CAPACITY;
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal load factor: " +
                                               loadFactor);

        this.loadFactor = loadFactor;
        threshold = initialCapacity;
        init();
    }
    public HashMap(int initialCapacity) {
        this(initialCapacity, DEFAULT_LOAD_FACTOR);
    }
    public HashMap() {
        this(DEFAULT_INITIAL_CAPACITY, DEFAULT_LOAD_FACTOR);
    }
    public HashMap(Map<? extends K, ? extends V> m) {
        this(Math.max((int) (m.size() / DEFAULT_LOAD_FACTOR) + 1,
                      DEFAULT_INITIAL_CAPACITY), DEFAULT_LOAD_FACTOR);
        inflateTable(threshold);

        putAllForCreate(m);
    }

put方法

	/*
	*	首先判断table数组是否为空，如果是空的进行初始化	inflateTable（）
	*/
    public V put(K key, V value) {
        if (table == EMPTY_TABLE) {
            inflateTable(threshold);
        }
        if (key == null)
            return putForNullKey(value);
        int hash = hash(key);
        int i = indexFor(hash, table.length);
        for (Entry<K,V> e = table[i]; e != null; e = e.next) {
            Object k;
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
                return oldValue;
            }
        }

        modCount++;
        addEntry(hash, key, value, i);
        return null;
    }

	/*
	*	这个方法主要是对table进行初始化，table = new Entry[capacity];
	*	它为什么不直接把我们传进来的容量作为数组大小呢，
	*	这个问题与上面容量和扩容都是2的次方数一样
	*	int capacity = roundUpToPowerOf2(toSize);找到大于这toSize的最小2的次方数
	*	例如	7-----》8		9---------》16
	*	那么它是如何实现的？
	*/
private void inflateTable(int toSize) {
        // Find a power of 2 >= toSize
        int capacity = roundUpToPowerOf2(toSize);

        threshold = (int) Math.min(capacity * loadFactor, MAXIMUM_CAPACITY + 1);
        table = new Entry[capacity];
        initHashSeedAsNeeded(capacity);
    }

	/*
	*	如果number》=MAXIMUM_CAPACITY 就等于MAXIMUM_CAPACITY   否则进入 (number > 1) ? Integer.highestOneBit((number - 1) << 1) : 1
	*	如果	number > 1	进入	Integer.highestOneBit((number - 1) << 1)  否则等于1
	*	这个方法的核心方法Integer.highestOneBit((number - 1) << 1)
	*	highestOneBit下面讲到是找到小于等于参数值的最小2的次方数
	*	我们原本是想找到大于这toSize的最小2的次方数，这两个方法看似完全相反
	*	我们想找》10的最小2的次方数
	*	1010 左移一位
	*	0001 1010
	*	highestOneBit（0001 1010）就是16
	*	为什么要减一，如果传入了一个2的次方数，比如8，不减一会返回16，需要减一再左移
	*/
private static int roundUpToPowerOf2(int number) {
        // assert number >= 0 : "number must be non-negative";
        return number >= MAXIMUM_CAPACITY
                ? MAXIMUM_CAPACITY
                : (number > 1) ? Integer.highestOneBit((number - 1) << 1) : 1;
    }

	/*
	*	假设我想找到	小于等于10的最小2次方数
	*	10------》1010
	*	8-------》1000
	*	
	*	现在看这个方法，假设我传进来了一个10( ... 0000 1010)
	*	右移一位							( ... 0000 0101)  进行或运算，有一则为一
	*	结果							( ... 0000 1111)	
	*	右移两位							( ... 0000 0011)  进行或运算
	*	结果							( ... 0000 1111)	
	*	。。。
	*	最终i=		 (  ... 0000 1111)	
	*  	i进行右移一位 （ 	... 0000 0111)进行相减
	* 	最终的返回值为(... 0000 1000) 8
	*/
public static int highestOneBit(int i) {
        // HD, Figure 3-1
        i |= (i >>  1);
        i |= (i >>  2);
        i |= (i >>  4);
        i |= (i >>  8);
        i |= (i >> 16);
        return i - (i >>> 1);
    }

Hai-Yang-code

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
详细分析jdk1.7的HashMap源码

先看一段代码public static void main(String[] args) { Map<String,Object> map=new HashMap<>(); map.put("key=1","value=100"); Object put = map.put("key=1", "value=200"); System.out.println(put); }结果//value=100我们知道map
复制链接

扫一扫