HashMap源码分析-jdk1.6和jdk1.8的区别

在java集合中,HashMap是用来存放一组键值对的数,也就是key-value形式的数据,而在jdk1.6和jdk1.8的实现有所不同。

JDK1.6的源码实现:

首先来看一下HashMap的类的定义:

HashMap继承了AbstractHashMap,实现了Map,Cloneable和Serializable接口,Map定义了一些公共的接口,而AbstractHashMap也实现了Map接口,并提供了一些默认的实现,如size方法和isEmpty方法等

在HashMap中,定义了几个常量:

初始容量,如果在创建HashMap的时候没有指定容量,就使用初始容量

最大容量,HashMap中存储元素的数组的最大的容量,为2的30次方

默认的加载因子,在扩容的时候使用

最重要的一个常量,用来存放我们添加的元素,

阈值,用来判断HashMap是否需要扩容,如果添加的元素超过该值,则需要扩容, 该值等于 capacity * loadFactor,比如 默认的初始容量为16, 默认的加载因子为0.75,则阈值就等于16*0.75=12,在table数组中,如果数组的元素个数超过12,则table数组就需要进行扩容。

HashMap提供了三个构造方法,我们可以指定初始容量和加载因子来构造HashMap

也可以只指定初始容量来构造HashMap

也可以都不指定,这时,初始容量和加载因子都是用的默认的值,一般情况下也不会去指定初始容量和加载因子。

如果采用不带参数的构造方法,可以看到存放元素的初始数组的大小为16,阈值为12。

相当于 Entry[] table = new Entry[16],在HashMap内部使用 Entry数组来存放元素的。

可以看到Entry表示的是一个单向链表的结构,next就是指向下一个节点;也就是说在HashMap内部,使用数组+链表的形式来存放元素,数组的每一项就是一个链表。HashMap的结构图大致如下所示:

接下来看一下对HashMap的常用操作:

1. put(key, value)操作,向HashMap中添加元素

1)添加的时候,首先要计算key的hash值,找到对应数组的下标

2)找到该下标对应的数组位置的链表,遍历链表,把值添加到该链表上

addEntry()方法如下:

用图来说明:

1. 初始化一个空的HashMap,此时还没有元素,结构如下:

假设要添加一对数据:key="zs", value="zhangsan"

首先对 key进行hash,比如 hash之后的值为5,之后在用hash和table.length来求数组的索引,

比如索引 i = 4,此时,这对元素就应该在 table[i] 即 table[4] 的位置处,取得该处的Entry链表,此时,链表为空,创建一个Entry节点,加入到该空链表中:

此时,在添加一对元素:key="ls", value="lisi",假如计算的索引 i 恰好等于4,此时,取得 table[4] 处的链表  Entry<K, V> = table[4], 用key = "ls"在这个链表上进行遍历,看看是否该key已存在:

此时,key="ls"并不存在,又会创建一个Entry节点,加入到该列表中:

如果此时,又添加 key="zs", value="zhangsan222",根据key计算到的索引为4,取出 table[4]处的链表,遍历链表,然后检查对应的key是否存在,检查到key已经存在了,所以会把新的值替换旧的值即可,不用创建新的节点。

2.get(key)操作

1)根据key计算hash值,根据hash值和数组长度计算数组的下标索引

2)取得该下标对应的链表,遍历链表,找到key对应的value

3.remove()操作,

    1)根据key计算hash值,根据hash值和数组长度计算数组的下标索引

    2)取得该下标对应的链表,遍历链表,删除key对应的Entry节点

removeEntryForKey()方法如下:

假设现在HashMap中元素的分布如下:

要删除 key="ls"的元素,假如计算的索引 i=4,要去遍历 table[4]处的链表,删除对应的节点,key="ls"为链表的第一个节点:

 

以上就是jdk1.6中HashMap的实现,是基于数组+链表的形式来存放数据的。

JDK1.8的源码实现:

在JDK1.8中,HashMap的实现比1.6的实现要复杂得多,1.8中引入了红黑树的数据结构;

除了上面列出来的常量外,新增加了几个常量:

表示的是,如果数组中链表的元素大于该值,则需要把该链表转化为红黑树,

如果链表中的元素个数小于该值,则把红黑树转换为链表

在JDK1.6中,使用一个Entry数组来存放元素,而在JDK1.8中,使用的Node数组和TreeNode来存放元素,

Node:其实,Node和Entry没有什么区别,

TreeNode:表示的是一个红黑树结构

 

### HashMapJDK 1.7JDK 1.8之间的差异 #### 数据结构变化 在 JDK 1.7 中,`HashMap` 的实现基于数组加链表的数据结构。当发生哈希冲突时,键值对会存储在一个单向链表中。而在 JDK 1.8 及之后版本里,在原有基础上进行了优化:除了使用数组加链表外,还引入了红黑树来替代长度过长的链表(默认情况下,当某个桶内的节点数超过一定阈值,默认为8),从而提高了查找效率。 ```java // JDK 1.7 链表形式 Entry<K,V>[] table; static class Entry<K,V> implements Map.Entry<K,V> { final K key; V value; Entry<K,V> next; int hash; } // JDK 1.8 节点或树形结构 transient Node<K,V>[] table; static class TreeNode<K,V> extends LinkedHashMap.Entry<K,V> { // 红黑树相关属性... } ``` #### 扩容机制调整 扩容是指当 `HashMap` 中元素数量达到临界值时自动增加容量的过程。对于这两种不同版本而言: - **JDK 1.7**: 当负载因子 * 容量 >= size 或者初始化时指定了初始容量,则触发扩容操作;每次扩容都会创建一个新的两倍大小的新数组,并重新计算所有已有数据的位置并迁移过去。 - **JDK 1.8**: 同样遵循上述原则进行扩容处理,但是有一个重要的区别在于它并不会立即复制整个旧表到新表上,而是采用了一种渐进式的策略——即只会在访问特定位置上的 bucket 时才真正执行转移工作,这有助于减少一次性大量内存分配带来的性能开销[^1]。 #### 并发控制改进 尽管两者都不是线程安全容器,但在多线程环境下表现有所不同: - **JDK 1.7** 下如果多个线程同时修改同一个 `HashMap` 实例可能会引发死循环等问题; - **JDK 1.8** 则通过更细粒度锁的方式减少了竞争条件的发生几率,不过仍然建议开发者们在并发场景下选用专门设计用于此类用途的数据结构如 ConcurrentHashMap[].
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值