HashMap继承与AbstractMap--并实现了 Map|Cloneable|Serializable接口
AbstractMap的出现是为了减少实现Map接口所需要工作--也就是先实现了Map的接口做了一次加工 。
AbstractMap:
其提供了Map的基本的实现,让我们要定义一个Map不用重头开始,直接继承abstractMap即可,然后按照需求重写对应的方法
其是一个抽象类,有唯一的一个抽象方法:
public abstract Set<Entry<K,V>> entrySet();
并实现了对Map的一些基础操作:删除-获取-查询,可以获取主要的视图:键-值-键值对(需要子类自己实现上面的entrySet方法)
AbstractMap不能直接支持put操作需要子类自己实现,如果不重写,在使用时会抛出异常,如下:
public V put(K key, V value) {
throw new UnsupportedOperationException();
}
public void putAll(Map<? extends K, ? extends V> m) {
for (Map.Entry<? extends K, ? extends V> e : m.entrySet())
put(e.getKey(), e.getValue());
}
另外: Map接口中有一个内部的类(接口)Map.Entry,AbstractMap也有两个内部类并实现了此接口
SimpleEntry<K, V> //可变的键值对
唯一的区别是:有没有setValue()方法的具体实现---后者正如以上的put()一样值会在必要的时候抛出一个异常
==>那么相当于继承了abstractMap也就实现了Map接口,为什么HashMap还要实现Map接口?
1、添加Map接口声明是为了Class类的getInterfaces这个方法能够直接获取到Map接口;
2、这就是一个写法上的错误,并没有深意;
HashMap的解析
注意:HashMap实现储存键值对的方法是:链接地址法
即:使用数组+(链表+树) ==> 当向Map中新增一个键值对是,然后先将KEY通过自己的hash算法,并通过hashcode对动态数组的长度取模来获取数组的索引并储存,当遇上此索引出有值即两个键值对的KEY的hashcode运算一样时,便实行链表机制,当链表过长且数组过大时会将某一段链表转换为树来储存
《类似桶排序》
以下:map的容量指:数组tab的length并非键值对的数量其需要通过size()获取
HashMap的成员变量
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16 Map的默认的初始容量
static final int MAXIMUM_CAPACITY = 1 << 30; //Map的最大容量,当构造器中参数值过大则会使用此值
static final float DEFAULT_LOAD_FACTOR = 0.75f;//负载因子(这是时间和空间成本上一种折中),用于计算出新的储存数组的大小,具体计算请看下文
static final int TREEIFY_THRESHOLD = 8;//链表树化的阙值,仅是树化的一个条件(与网上大多数博客说法不一样,读者自行判断)
static final int UNTREEIFY_THRESHOLD = 6;//树链化的阙值(当resize()执行时且其tab[]的某个索引下的子节点为树结构且数值小于此值是将树结构转为链表)
static final int MIN_TREEIFY_CAPACITY = 64;//最小的可被树化表(table|数组)的容量
链表转换为树的时机是:执行put操作是判断此tab[index]的链表长度是否达到阙值且tab.length的长度小于MIN_TREEIFY_CAPACITY
树转换为链表的时机是: 执行resize(),重塑Map容器的时候,而当Map键值对的数量size的值大于threshold时resize()会执行
transient int size; //记录总的键值对的数量
transient Node<K,V>[] table;//主要储存容器-表(数组)
transient int modCount;//记录此Map-表的结构变化次数--不包括修改数据
transient Set<Map.Entry<K,V>> entrySet;//Map主要视图之一的键值对视图集合
int threshold;//当前Map中键值对的数量阙值
final float loadFactor;//当前负载因子
HashMap的构造方法
public HashMap(int initialCapacity, float loadFactor)//容量和负载因子构造器--两者都影响map的性能
public HashMap(Map<? extends K, ? extends V> m) {
this.loadFactor = DEFAULT_LOAD_FACTOR;
putMapEntries(m, false);
}
final void putMapEntries(Map<? extends K, ? extends V> m, boolean evict) {
int s = m.size();//获取原Map的实体数量
if (s > 0) {
if (table == null) { // pre-size当前的map为空
float ft = ((float)s / loadFactor) + 1.0F;
//(阙值(threshold)= capacity*loadFactor)>s==>s/loadFactor小于Map的容量
int t = ((ft < (float)MAXIMUM_CAPACITY) ?
(int)ft : MAXIMUM_CAPACITY);
if (t > threshold) //threshold默认为0
threshold = tableSizeFor(t);
}
else if (s > threshold)
resize();
for (Map.Entry<? extends K, ? extends V> e : m.entrySet()) {
K key = e.getKey();
V value = e.getValue();
putVal(hash(key), key, value, false, evict);
}
}
}
、、、//其他构造器,可以有无参或容量或map对象--不可以单独用负载因子创建
获取表的索引的过程:
通过KEY的-->static final int hash(Object key) --> (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
然后通过hash码对表的长度取模i = (n - 1) & hash
public V put(K key, V value)-->final V putVal(int hash, K key, V value, boolean onlyIfAbsent,boolean evict)
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
if ((tab = table) == null || (n = tab.length) == 0)//先判断表是否初始化
n = (tab = resize()).length;
if ((p = tab[i = (n - 1) & hash]) == null)//如果表中此索引无数据,直接将带插入的数据放入其中
tab[i] = newNode(hash, key, value, null);
else {
Node<K,V> e; K k;
//判断是否是同一个键-如果KEY为string类型的则只要其字符串一样返回TRUE---先通过hash判断可以增加比较效率
//hash的值和Object的原生的hashCode()方法有关
//hash码一样不一定是一个对象,但hash码不一样一定不是一个对象
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k)))) //当key为null时会跑出异常所以需要先判断key!=null
e = p;
else if (p instanceof TreeNode)//如果表中此索引位置已近树化则按树的插入方法进行插入
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {//如果是一个新的键,则插入表索引位置的链表结构的尾部
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) //如果链表长度太长则树化--不一定会树化,仅是一个条件
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&//如果已经存在此键且找到,退出循环
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) { // 在表中找到了此键,替换值
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)//onlyIfAbsent是一个决定是否不覆盖原数据的因素,put方法为false,即覆盖
//如果不想被覆盖,调用putIfAbsent(K key, V value);
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;//结构改变次数加1
if (++size > threshold)//判断是否应该进行表的重塑
resize();
afterNodeInsertion(evict);//未实现的方法
return null;
}
由put方法可知:map的键值对的key允许为NULL + hashmap是线程不安全的---但可以通过synchronizedMap(Map<K,V> m)变为线程安全的
final Node<K,V>[] resize()
final Node<K,V>[] resize() {
Node<K,V>[] oldTab = table;//由于新数组会覆盖旧数组,所以要临时先备份一份,用于对新数组重新赋值
int oldCap = (oldTab == null) ? 0 : oldTab.length;
int oldThr = threshold; //获取当前表的容量和阙值
int newCap, newThr = 0;
if (oldCap > 0) {
if (oldCap >= MAXIMUM_CAPACITY) { //如果当前表的容量达到了最大值
threshold = Integer.MAX_VALUE;//最大值修改为Integer的最大值
return oldTab;
}
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
newThr = oldThr << 1; // double threshold 扩充容量为当前容量的2倍
}
else if (oldThr > 0) // initial capacity was placed in threshold
newCap = oldThr;
else { // zero initial threshold signifies using defaults
newCap = DEFAULT_INITIAL_CAPACITY;
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
if (newThr == 0) {
float ft = (float)newCap * loadFactor;
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
(int)ft : Integer.MAX_VALUE);
}
threshold = newThr;//改变当前MAP的容量的阙值
@SuppressWarnings({"rawtypes","unchecked"})
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];//安新的容量创造数组并将老的表数据转移到新表中
table = newTab;
if (oldTab != null) {
for (int j = 0; j < oldCap; ++j) {
Node<K,V> e;
if ((e = oldTab[j]) != null) {
oldTab[j] = null;
if (e.next == null)
newTab[e.hash & (newCap - 1)] = e;
else if (e instanceof TreeNode)//如果此节点已经树化则按照TreeNode的转移方式复制
((TreeNode<K,V>)e).split(this, newTab, j, oldCap);//其中涉及到是否还要以树的结构复制
else { // preserve order 保存顺序 复制此节点下的链表
......
}
}
}
}
return newTab;
}