HashMap是基于哈希表(散列表),实现Map接口的双列集合,数据结构是“链表散列”,也就是数组+链表 ,key唯一的value可以重复,允许存储null 键null 值,元素无序。
初始化
- hashMap继承了abstractMap,实现了Map接口。当new一个hashMap时在堆内存中开辟了一块空间,构造方法中初始化了负载因为0.75f,初始化完成,成员变量table数组默认为null,size默认为0;负载因子0.75f。
put(K,V)方法
- 首先会调用putVal()方法,putVal()里调用hash(K)获取键的hash值传入putVal方法中,当我们放入第一个元素时,如果底层数组还是null,这时候触发resize()方法系统会初始化一个长度为16的Node数组,经过计算计算出当前元素的下标,当继续添加数据时计算的下标可能与原有下标一致,此时发生哈希碰撞(冲突),此时把当前节点转换成单向链表,当链表长度到8时,防止哈希表碰撞攻击将链表转化为红黑树来处理,当hashmap中的size > loadFactory * capacity即会发生扩容,每次扩容是当前数组的2倍
jdk7 8 区别
jdk1.7中hashMap采用头插法,在并发情况下如果插入元素的两个线程都调用了rehash扩容方法,
会导致链表成环的问题。
jdk1.8后使用尾插法,扩容转移后前后链表顺序不变,保持之前节点的引用关系。
为啥重写equals方法的时候需要重写hashCode方法呢?
- 因为在java中,所有的对象都是继承于Object类。
- Ojbect类中有两个方法equals、hashCode,这两个方法都是用来比较两个对象是否相等的。
- 在未重写equals方法我们是继承了object的equals方法,那里的 equals是比较两个对象的:内存地址,显然我们new了2个对象内存地址肯定不一样:
对于值对象,==比较的是两个对象的值
对于引用对象,比较的是两个对象的地址
所以如果我们对equals方法进行了重写,建议一定要对hashCode方法重写,以保证相同的对象返回相同的hash值,不同的对象返回不同的hash值。
map集合遍历方式
四种:
1.Set<K> keySet() 将所有的键封装到set集合
2.V get(Object key) 根据键获取值
3.Set<Map.Entry<K,V>> entrySet() 获取所有的键值对集合
4.Collection<V> values() 获取所有的值
Hashtable与HashMap的区别
- Map是一个以键值对存储的接口。Map下有两个具体的实现,分别是HashMap和HashTable.
- HashMap是线程非安全的,HashTable是线程安全的,所以HashMap的效率高于HashTable.
- HashMap允许键或值为空,而HashTable不允许键或值为空.
hashMap中put是如何实现的?
-
计算关于key的hashcode值(与Key.hashCode的高16位做异或运算)
-
如果散列表为空时,调用resize()初始化散列表
-
如果没有发生碰撞,直接添加元素到散列表中去
-
如果发生了碰撞(hashCode值相同),进行三种判断
4.1: 若key地址相同或者equals后内容相同,则替换旧值
4.2: 如果是红黑树结构,就调用树的插入方法
4.3: 链表结构,循环遍历直到链表中某个节点为空,尾插法进行插入,插入之后判断链表个数是否到达变成红黑树的阙值8;也可以遍历到有节点与插入元素的哈希值和内容相同,进行覆盖。
-
如果桶满了大于阀值,则resize进行扩容
HashMap中get是如何实现的?
- 对key的hashCode进行hashing,与运算计算下标获取bucket位置,如果在桶的首位上就可以找到就直接返回,否则在树中找或者链表中遍历找,如果有hash冲突,则利用equals方法去遍历链表查找节点。
为什么引入红黑树?
- JDK 1.8 以前 HashMap 的实现是 数组+链表,即使哈希函数取得再好,也很难达到元素百分百均匀分布。当 HashMap 中有大量的元素都存放到同一个桶中时,这个桶下有一条长长的链表,这个时候 HashMap 就相当于一个单链表,假如单链表有 n 个元素,遍历的时间复杂度就是 O(n),完全失去了它的优势。针对这种情况,JDK 1.8 中引入了 红黑树(查找时间复杂度为 O(logn))来优化这个问题。