hashmap:构成原理,扩容过程,put过程,为什么长度总是2的N次方,是否线程安全
- 构成原理:
- hashmap是散列桶(数组和链表),它存储的是键值对映射
- hashmap采用的数据结构是数组和链表,继承了数组和线性查找和链表的寻址修改
- hashmap是非synchronized的,所以它很快
延申知识点:synchronized是Java关键字,当它修饰一个方法或一个代码块时,它保证了同一时刻只有一个线程能执行这个代码块。该关键字对应的lock锁。synchronized是Java自带的关键字,而lock是接口。synchronized在发生异常时会自动释放线程占有的锁,因此不会发生死锁现象;而lock需要主动通过unlock()才会释放线程占有的锁,所以容易发生死锁现象,应在finally块中释放锁。synchronized不会主动响应中断,等待的线程会一直等待下去;lock可以让等待的锁响应中断。通过synchronized不知道有没有成功获取锁,但通过lock可以知道。 - hashmap可以接受null为键值,但hashtable键值都不可为null
扩容过程
1.为什么扩容?
当hashmap中的元素越来越多的时候,碰撞的几率就越来越高了(因为数组长度是固定的)。这时候为了查找效率,就需要扩容了(类似于ArrayList的扩容原理)。原数组中的数据必须重新计算位置放进新数组,这就是消耗性能的resize。
2.什么时候扩容?
当hashmap中的元素个数超过阈值size*loadFactor(负载因子,一般默认0.75)时就会进行扩容,即扩大一倍。扩容是非常消耗性能的操作,所以最好一开始就预估好大致的需要空间。比如有1000个元素时,最好能设定size**loadFactor>1000,即new HashMap(2048)。hashmap的默认容量为16。
3.为什么扩容都是2的幂次方
源代码中的按位与&操作:计算hashcode在bucket数组中的位置i = (n - 1) & hash
容量是2的n次幂,可以使得添加的元素均匀分布在HashMap中的数组上,减少hash碰撞,避免形成链表的结构,使得查询效率降低。
put过程
- put过程
HashMap在put方法中,它使用hashCode()和equals()方法。当我们通过传递key-value对调用put方法的时候,HashMap使用Key hashCode()和哈希算法来找出存储key-value对的索引。如果索引处为空,则直接插入到对应的数组中,否则,判断是否是红黑树,若是,则红黑树插入,否则遍历链表,若长度超过8,则将链表转为红黑树,转成功之后 再插入。
-
红黑树
hashmap链表深度超过8的时候,需要将链表转为红黑树,可以提高查询效率。
红黑树定义:
1.平衡二叉查找树
2.根节点是黑色
3.红节点的子节点一定是黑色
4.任一路径上的黑色节点相同 -
hashCode()和equals()方法
hashCode()相同不等于equals()相同,但equals()相同代表 hashCode()一定相同。
计算key的hashcode,找到数组中对应位置的某一元素,然后通过key的equals方法在对应位置的链表中找到需要的元素。
是否线程安全
1.hashmap不安全,但效率高。在多线程环境下,使用Hashmap进行put操作会引起死循环,导致CPU利用率接近100%,所以在并发情况下不能使用HashMap。
2.hashtable安全,但效率低。Hashtable是用synchronized关键字来保证线程安全。
3.ConcurrentHashMap高效且安全。ConcurrentHashMap使用的分段锁技术。将ConcurrentHashMap容器的数据分段存储,每一段数据分配一个Segment(锁),当线程占用其中一个Segment时,其他线程可正常访问其他段数据。