1.HashMap的概述
HashMap是map接口的实现,是线程非同步的。语序key为null,并且顺序是会变的。
HashMap的数据结构
HashMap实际上是一个数组和链表的结合体,简称链表散列。
从图中可以看出,HashMap是一个数组结构,而每个数组中的元素又是一个链表
Entry<,> Map.Entry<,> {
;
;
Entry<,> ;
;
每个Entry指向下一个元素的引用,然而为什么数组中的每个元素是一个链表呢?因为HashMap
如果数组该位置上已经存放有其他元素了,那么在这个位置上的元素将以链表的形式存放,新加入的放在链头,最先加入的放在链尾。如果数组该位置上没有元素,就直接将该元素放到此数组中的该位置上。
3.HashMap中的方法
put(key, value) {
(key == )
putForNullKey(value);
hash = (key.hashCode());
i = (hash, .);
(Entry<,> e = [i]; e != ; e = e.) {
Object k;
(e.== hash && ((k = e.) == key || key.equals(k))) {
oldValue = e.;
e.= value;
e.recordAccess();
oldValue;
}
}
++;
addEntry(hash, key, value, i);
;
}
这个方法主要是在添加一个元素,首先判断key是否为空,
当key为null时,调用putForNullKey方法,将value放置在数组第一个位置。
当key不为空时,通过key的hashcode计算hash值,搜索指定hash值在对应table中的索引,判断是否为null,为null则添加到索引处。
addEntry(hash, key, value, bucketIndex) {
Entry<,> e = [bucketIndex];
[bucketIndex] = Entry<,>(hash, key, value, e);
(++ >= )
resize(* .);
}
addEntry(hash, key, value, i)方法根据计算出的hash值,将key-value对放在数组table的i索引处。
get(Object key) {
(key == )
getForNullKey();
hash = (key.hashCode());
(Entry<,> e = [(hash, .)];
e != ;
e = e.) {
Object k;
(e.== hash && ((k = e.) == key || key.equals(k)))
e.;
}
;
}
理解put方法后,get方法其实就好理解了。反之即可,这里不再重复。
4. HashMap的resize(rehash):
当HashMap中的元素越来越多的时候,hash冲突的几率也就越来越高,因为数组的长度是固定的。所以为了提高查询的效率,就要对HashMap的数组进行扩容,数组扩容这个操作也会出现在ArrayList中,这是一个常用的操作,而在HashMap数组扩容之后,最消耗性能的点就出现了:原数组中的数据必须重新计算其在新数组中的位置,并放进去,这就是resize。
那么HashMap什么时候进行扩容呢?当HashMap中的元素个数超过数组大小*loadFactor时,就会进行数组扩容,loadFactor的默认值为0.75,这是一个折中的取值。也就是说,默认情况下,数组大小为16,那么当HashMap中元素个数超过16*0.75=12的时候,就把数组的大小扩展为 2*16=32,即扩大一倍,然后重新计算每个元素在数组中的位置,而这是一个非常消耗性能的操作,所以如果我们已经预知HashMap中元素的个数,那么预设元素的个数能够有效的提高HashMap的性能。
5. HashMap的性能参数:
HashMap 包含如下几个构造器:
HashMap():构建一个初始容量为 16,负载因子为 0.75 的 HashMap。
HashMap(int initialCapacity):构建一个初始容量为 initialCapacity,负载因子为 0.75 的 HashMap。
HashMap(int initialCapacity, float loadFactor):以指定初始容量、指定的负载因子创建一个 HashMap。
HashMap的基础构造器HashMap(int initialCapacity, float loadFactor)带有两个参数,它们是初始容量initialCapacity和加载因子loadFactor。
initialCapacity:HashMap的最大容量,即为底层数组的长度。
loadFactor:负载因子loadFactor定义为:散列表的实际元素数目(n)/ 散列表的容量(m)。
负载因子衡量的是一个散列表的空间的使用程度,负载因子越大表示散列表的装填程度越高,反之愈小。对于使用链表法的散列表来说,查找一个元素的平均时间是O(1+a),因此如果负载因子越大,对空间的利用更充分,然而后果是查找效率的降低;如果负载因子太小,那么散列表的数据将过于稀疏,对空间造成严重浪费。
HashMap的实现中,通过threshold字段来判断HashMap的最大容量: