什么是HashMap?
HashMap是基于哈希表的Map接口的非同步实现。此实现提供所有可选的映射操作,并允许使用null值和null键。此类不保证映射的顺序,特别是它不保证该顺序恒久不变。
HashMap的数据结构
在Java编程语言中,最基本的结构就是两种,一个是数组,另外一个是模拟指针(引用),所有的数据结构都可以用这两个基本结构来构造的,HashMap也不例外。HashMap实际上是一个“链表散列”的数据结构,即数组和链表的结合体。
文字描述永远要配上图才能更好的讲解数据结构,HashMap的结构图
从上图中可以看出,HashMap底层就是一个数组结构,数组中的每一项又是一个链表或者红黑树。当新建一个HashMap的时候,就会初始化一个数组。
下面先通过大概看下HashMap的核心成员。
public class HashMap<K,V> extends AbstractMap<K,V>
implements Map<K,V>, Cloneable, Serializable {
// 默认容量,默认为16,必须是2的幂
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;
// 最大容量,值是2^30
static final int MAXIMUM_CAPACITY = 1 << 30
// 装载因子,默认的装载因子是0.75
static final float DEFAULT_LOAD_FACTOR = 0.75f;
// 解决冲突的数据结构由链表转换成树的阈值,默认为8
static final int TREEIFY_THRESHOLD = 8;
// 解决冲突的数据结构由树转换成链表的阈值,默认为6
static final int UNTREEIFY_THRESHOLD = 6;
/* 当桶中的bin被树化时最小的hash表容量。
* 如果没有达到这个阈值,即hash表容量小于MIN_TREEIFY_CAPACITY,当桶中bin的数量太多时会执行resize扩容操作。
* 这个MIN_TREEIFY_CAPACITY的值至少是TREEIFY_THRESHOLD的4倍。
*/
static final int MIN_TREEIFY_CAPACITY = 64;
static class Node<K,V> implements Map.Entry<K,V> {
//...
}
// 存储数据的数组
transient Node<K,V>[] table;
// 遍历的容器
transient Set<Map.Entry<K,V>> entrySet;
// Map中KEY-VALUE的数量
transient int size;
/**
* 结构性变更的次数。
* 结构性变更是指map的元素数量的变化,比如rehash操作。
* 用于HashMap快速失败操作,比如在遍历时发生了结构性变更,就会抛出ConcurrentModificationException。
*/
transient int modCount;
// 下次resize的操作的size值。
int threshold;
// 负载因子,resize后容量的大小会增加现有size * loadFactor
final float loadFactor;
}
HashMap的初始化
通过源码可以看出初始化时并没有初始化数组table,那只能在put操作时放入了,为什么要这样做?估计是避免初始化了HashMap之后不使用反而占用内存吧,哈哈哈。
HashMap的存储操作
下面我们详细讲一下HashMap是如何确定数组索引的位置、进行put操作的详细过程以及扩容机制(resize)
hash计算,确定数组索引位置
不管增加、删除、查找键值对,定位到哈希桶数组的位置都是很关键的第一步。前面说过HashMap的数据结构是数组和链表的结合,