HashMap的底层实现原理

最新推荐文章于 2023-09-01 06:02:01 发布

一叶飘零晋

最新推荐文章于 2023-09-01 06:02:01 发布

阅读量207

点赞数

分类专栏：面试文章标签：哈希算法 java 数据结构

本文链接：https://blog.csdn.net/ChenJin_2/article/details/131044173

版权

面试专栏收录该内容

10 篇文章 0 订阅

订阅专栏

红黑数演示地址：https://www.cs.usfca.edu/~galles/visualization/Algorithms.html
一、构造源码解读

public class HashMap<K,V> extends AbstractMap<K,V>
    implements Map<K,V>, Cloneable, Serializable {
   //1、实现了两个Map接口 ，重复多余
	
	//3、属性部分
	final float loadFactor;
	static final float DEFAULT_LOAD_FACTOR = 0.75f;
	int threshold;
	transient Node<K,V>[] table;//底层数组
	//2、空参构造
	public HashMap() {
        this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
    }
	
	
	//4、调用有参构造
	public HashMap(int initialCapacity) {
        this(initialCapacity, DEFAULT_LOAD_FACTOR);
    }

	
	//5、调到HashMap中
	public HashMap(int initialCapacity, float loadFactor) {
		
		//6、健壮性处理
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal initial capacity: " +
                                               initialCapacity);
        if (initialCapacity > MAXIMUM_CAPACITY)
            initialCapacity = MAXIMUM_CAPACITY;
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal load factor: " +
                                               loadFactor);
      // 7、loadFactor=0.75                                        
        this.loadFactor = loadFactor;
		//8、调用tableSizeFor方法
        this.threshold = tableSizeFor(initialCapacity);
    }
//9、tableSizeFor=====》确定主数组长度，返回的是最接近参数的2的n次幂
	static final int tableSizeFor(int cap) {
        int n = cap - 1;
        n |= n >>> 1;
        n |= n >>> 2;
        n |= n >>> 4;
        n |= n >>> 8;
        n |= n >>> 16;
        return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
    }

//10、调用put方法
public V put(K key, V value) {//传入键值对
						//11、调用hash(方法)
        return putVal(hash(key), key, value, false, true);
    }

//12、调用hash()方法  
static final int hash(Object key) {//返回值是哈希码
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }


//13、putVal()方法
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        //14、if走
        if ((tab = table) == null || (n = tab.length) == 0)
        	//15走进resize方法中
            n = (tab = resize()).length;//24、n = 16
//25、经过一个公式：(n-1)& hash 算出键值对在主数组中的位置。
//26、table[i]无数据，是null  if -->走
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        else {
        //31、“重地不走” if
        //如果遇到相同的key 走
            Node<K,V> e; K k;
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                //27、赋值给e
                e = p;
                // 32、 p不是树 不走
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {
            		
                for (int binCount = 0; ; ++binCount) {//33、死循环
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);//34、尾插操作
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            //28、走入if
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                
                    e.value = value;//把 30 替换成10
                afterNodeAccess(e);
                return oldValue;//29 、把替换的值放回  return 10
            }
        }
        ++modCount;
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }


//16、走进resize方法中
	final Node<K,V>[] resize() {
        Node<K,V>[] oldTab = table;//table：null   oldTab:null
        int oldCap = (oldTab == null) ? 0 : oldTab.length;//oldTab:0
        int oldThr = threshold;  oldThr:16
        int newCap, newThr = 0;
        if (oldCap > 0) {//17、不走
          if (oldCap >= MAXIMUM_CAPACITY) {
                threshold = Integer.MAX_VALUE;
                return oldTab;
            }
            else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                     oldCap >= DEFAULT_INITIAL_CAPACITY)
                newThr = oldThr << 1; // double threshold
        }
       else if (oldThr > 0) // 18、走
            newCap = oldThr;//newCap：16
       else {             
            newCap = DEFAULT_INITIAL_CAPACITY;
            newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
        }

        if (newThr == 0) {//19、走
  float ft = (float)newCap * loadFactor;// 16 * 0.75=12 ==ft
            newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                      (int)ft : Integer.MAX_VALUE);//20、newThr = 12
                      
        }
        //21、threshold=12
        threshold = newThr;
        @SuppressWarnings({"rawtypes","unchecked"})
        Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];//22、创建一个长度为16的node数组
        table = newTab;//23、底层数组长度为16的node数组
        if (oldTab != null) {
            for (int j = 0; j < oldCap; ++j) {
                Node<K,V> e;
                if ((e = oldTab[j]) != null) {
                    oldTab[j] = null;
                    if (e.next == null)
                        newTab[e.hash & (newCap - 1)] = e;
                    else if (e instanceof TreeNode)
                        ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                    else { // preserve order
                        Node<K,V> loHead = null, loTail = null;
                        Node<K,V> hiHead = null, hiTail = null;
                        Node<K,V> next;
                        do {
                            next = e.next;
                            if ((e.hash & oldCap) == 0) {
                                if (loTail == null)
                                    loHead = e;
                                else
                                    loTail.next = e;
                                loTail = e;
                            }
                            else {
                                if (hiTail == null)
                                    hiHead = e;
                                else
                                    hiTail.next = e;
                                hiTail = e;
                            }
                        } while ((e = next) != null);
                        if (loTail != null) {
                            loTail.next = null;
                            newTab[j] = loHead;
                        }
                        if (hiTail != null) {
                            hiTail.next = null;
                            newTab[j + oldCap] = hiHead;
                        }
                    }
                }
            }
        }
        return newTab;
    }




 final void treeifyBin(Node<K,V>[] tab, int hash) {
        int n, index; Node<K,V> e;
        if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
            resize();
        else if ((e = tab[index = (n - 1) & hash]) != null) {
            TreeNode<K,V> hd = null, tl = null;
            do {
                TreeNode<K,V> p = replacementTreeNode(e, null);
                if (tl == null)
                    hd = p;
                else {
                    p.prev = tl;
                    tl.next = p;
                }
                tl = p;
            } while ((e = e.next) != null);
            if ((tab[index] = hd) != null)
                hd.treeify(tab);
        }
    }


}

总结：

1、当产生hash冲突怎么办如下图：

在这里插入图片描述
1、数组结构：数组+链表+红黑树，红黑树是1.8之后出现的。

数组：采用的是一段连续的单元来存储数据的。

特点：查询快，插入慢

链表：是一种物理的存储单元上非连续的、非顺序的存储结构。
特点：查找比较慢，插入比较快。

2、算法：
hash算法(也叫散列):，就是把任意长度值（key）通过散列算法变成固定长度的key（地址）通过这个地址进行访问的数据结构吗。

在这里插入图片描述

2、hashmap为什么要进行取模？

在HashMap中，为了能够将key映射到一个索引上，需要使用哈希函数对key进行处理，计算出一个哈希值。哈希值一般是一个整数，但是哈希值的范围可能会非常大，可能会超过HashMap的存储数组大小，因此需要对哈希值进行取模操作，以得到在HashMap中的实际索引位置。

具体来说，HashMap使用取模运算来将哈希值映射到桶的索引位置。假设原始的哈希值为h，HashMap的存储数组长度为n，则可以使用下面的公式来计算h的索引位置i：

i = h & (n - 1)

其中&表示按位与运算符，n-1是一个二进制值，它的每一位都是1，表示一个长度为n的二进制数的最大值。因此，将哈希值和n-1进行与运算，可以得到位于[0, n-1]范围内的一个索引位置。这样就可以将key和value存储到HashMap的相应位置上，以实现高效的键值对的查找和插入操作。

需要注意的是，在使用哈希函数计算哈希值时，可能会出现哈希冲突，即不同的key计算出的哈希值相同。为了解决哈希冲突，HashMap在同一个桶中维护了一个链表，将具有相同索引的键值对按照插入顺序组织成一个链表来存储。当哈希函数计算出的索引位置已经被占用时，就将新的键值对插入到链表的末尾。这样就可以处理哈希冲突，保证HashMap的查找和插入操作仍然具有很高的效率。

hashmap默认的长度是16 为了节省空间。

3、此时会产生hash冲突?如何解决hash冲突 ==也问为什么使用链表？

1.7：当hash冲突时，会判断key是否相同。如果key相同。会直接覆盖value值。如果key不相同，会加入链表进行一个头插操作。也就是说原的会给新来的让出位置，然后新的节点的next指向旧的节点。

1.8：当链表长度超过8的时候。会转为红黑数。
在这里插入图片描述

 final void treeifyBin(Node<K,V>[] tab, int hash) {
        int n, index; Node<K,V> e;
        if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
            resize();
        else if ((e = tab[index = (n - 1) & hash]) != null) {
            TreeNode<K,V> hd = null, tl = null;
            do {
                TreeNode<K,V> p = replacementTreeNode(e, null);
                if (tl == null)
                    hd = p;
                else {
                    p.prev = tl;
                    tl.next = p;
                }
                tl = p;
            } while ((e = e.next) != null);
            if ((tab[index] = hd) != null)
                hd.treeify(tab);
        }
    }

static final class TreeNode<K,V> extends LinkedHashMap.Entry<K,V> {
	 	TreeNode<K,V> parent;  // red-black tree links
        TreeNode<K,V> left;
        TreeNode<K,V> right;
        TreeNode<K,V> prev;    // needed to unlink next upon deletion
        boolean red;
        TreeNode(int hash, K key, V val, Node<K,V> next) {
            super(hash, key, val, next);
        }
}

4、为什么红黑树插入慢查找快

红黑树在插入的时候会进行右旋或者左旋操作。保持这种结构，会会费一定时间。所以和链表相比。他的插入慢，而查询快。

5、为什么不一上来就使用红黑树而是先用链表再使用红黑树

因为链表插入快，删除快。查询慢。二红黑树插入的时候要进行一次左旋或右旋操作，所以插入慢，查询快。鱼与熊掌不可兼得。

6、map.get（）方法详解。

 public V get(Object key) {
        Node<K,V> e;
        return (e = getNode(hash(key), key)) == null ? null : e.value;
    }

final Node<K,V> getNode(int hash, Object key) {
        Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
        if ((tab = table) != null && (n = tab.length) > 0 &&
            (first = tab[(n - 1) & hash]) != null) {
            if (first.hash == hash && // always check first node
                ((k = first.key) == key || (key != null && key.equals(k))))
                return first;
            if ((e = first.next) != null) {
                if (first instanceof TreeNode)
                    return ((TreeNode<K,V>)first).getTreeNode(hash, key);
                do {
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        return e;
                } while ((e = e.next) != null);
            }
        }
        return null;
    }

首先。会根据hash(key)算出hash的值。根据hash值算出他的的一个数组下标。判断这个这个位置的是否有值，如果没有值直接返回null。如果有值。判断他的key是否相等。如果key相等。则直接放回他的value值。
如果key不相等。则会有一个递归操作。判断node的next不为空。在里面进行循环判断直到找到key相等的node对象。然后返回value值。

7、hashmap怎么进行扩容

HashMap在添加元素时会根据负载因子来判断是否需要扩容，默认负载因子为0.75，即当HashMap中的元素个数超过容量的75%时就会进行扩容。扩容操作会新建一个更大的数组，然后将原来的元素重新哈希映射到新数组中。这个操作会存在一定的开销，因此需要谨慎设计HashMap容量大小和负载因子。

8、扩容因子为什么是0.75

HashMap的扩容因子为0.75是一个经验值。经验表明，这个值可以在时间和空间效率之间取得一个合理的折中。如果扩容因子太小，那么HashMap就需要频繁地进行扩容操作，增加了时间开销；如果扩容因子太大，虽然减少了扩容的频率，但是随着HashMap中元素数量的增加，每次扩容带来的空间开销也会越来越大，增加了空间开销。因此，0.75作为一个比较合理的经验值，能够在时间和空间效率之间取得一个合理的平衡点。当HashMap中元素数量超过容量的75%时，就会触发扩容操作，将容量扩大一倍，并重新分配元素位置，从而保持HashMap的性能。

9、hashmap的数组什么时候创建

HashMap内部维护了一个Entry类型的数组用于存储键值对。这个数组在HashMap初始化时不会被创建，而是会在第一次向HashMap中添加元素时被创建，并根据元素个数确定数组的大小。

具体来说，当向HashMap中添加第一个元素时，HashMap会根据初始容量（默认为16）创建一个长度为16的Entry数组。随着不断添加元素，如果元素数量超过了数组大小的75%（负载因子默认值），就会触发扩容操作，即创建一个长度为原数组长度的两倍的新数组，并将原数组中的元素重新分配到新的数组中，从而保证HashMap的性能。

需要注意的是，在创建数组时，HashMap会尽量保证数组大小为2的幂，以便通过位运算来加快哈希计算的速度。因此，实际上创建的数组大小可能会比指定的初始容量和扩容后容量要稍微大一些。

10、hashmap扩容因子有什么作用？

HashMap的扩容因子是指HashMap中元素数量与数组容量的比值，也称为负载因子。一般情况下，HashMap的负载因子默认为0.75，表示当HashMap中元素数量超过数组容量的75%时，就会触发扩容操作。目的是为了计算扩容阀值

比如当使用无参构造时候默认数组长度是16 此时的扩容阀值是16*75% =12。

11、hashmap链表转为红黑数需要达到什么条件？

1、是链表长度达到8。
2、是数组长度大于64。

缺一不可，否则即使链表长度大于9也不会转为红黑树。会进行一个realize进行·扩容。

12、node 节点中hash怎么得到的？

将hashCode值右移16位并且与原来的hashCode值进行^(按位异或)操作

&（按位与）
^(按位异或)
在这里插入图片描述

13、为什么采用这种算法？

在这里插入图片描述
首先数组长度一定是2的n次方。（为什么？）看下面代码

static final int tableSizeFor(int cap) {
        int n = cap - 1;
        n |= n >>> 1;
        n |= n >>> 2;
        n |= n >>> 4;
        n |= n >>> 8;
        n |= n >>> 16;
        return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
    }