HashMap终极解决

最新推荐文章于 2020-10-07 15:52:20 发布

xueyanguangyao

最新推荐文章于 2020-10-07 15:52:20 发布

阅读量265

点赞数

是否在面试时老被问到HashMap的问题，那么来一次了断吧^_^

基本的诸如HashMap是否属于Collection接口就不谈了，来点深入的

HashMap的数据结构用的是什么?

数组 + 链表

以下为HashMap的源码：

transient Entry[] table; //数组

public HashMap() {
this.loadFactor = DEFAULT_LOAD_FACTOR;
threshold = (int)(DEFAULT_INITIAL_CAPACITY * DEFAULT_LOAD_FACTOR);
table = new Entry[DEFAULT_INITIAL_CAPACITY];
init();
}

static class Entry<K,V> implements Map.Entry<K,V> {
final K key;
V value;
Entry<K,V> next;
final int hash;

其中，table为数组，Entry为链表

HashMap的实现方法

再来看下get方法的实现，先看源码：
public V get(Object key) {
if (key == null)
return getForNullKey();
int hash = hash(key.hashCode()); //计算出key的hash值
for (Entry<K,V> e = table[indexFor(hash, table.length)]; //hash值除以数组的长度
e != null;
e = e.next) {
Object k;
if (e.hash == hash && ((k = e.key) == key || key.equals(k)))
return e.value;
}
return null;
}

static int indexFor(int h, int length) {
return h & (length-1); //hash值除以数组的长度-1
}

如何解决hash冲突方法：
开放地址法:
eg: 比如<1,2>已经存在table数组的31的位置上了，再来一个<101,102>，其通过哈希后说：我也应该在31的位置上，但是table说，你后来，你再在31附近找个空位安置下吧。当然，具体怎么找，有规则的
链地址法:
eg: <101,102>来到时，发现31的位置已经被占了，这时table说：<1,2>，你带下<101,102>；其实就是要<1,2>把<101,102>的引用存储了。但是<1,2>说：我怎么存储<101,102>的引用了，我没位置呀。这是为什么entry类是链表的原因

比较：
开放地址法一般需要2倍实际数据大小的空间，因为要留下一定的空闲地址去存储相同hashCode的<key,value>；并且查找相邻空闲地址也是一项比较费时间的任务；链地址法，就不需要2倍的空间（table数组），但是需要存储额外的信息，比如next信息；总体来看，链地址法好点（关键是节省了查找相邻地址的时间）

hashMap用的是链地址法。

hashMap在每次插入数据前，会检查table数组的实际容量，如果实际容量>=初始容量，则把 table的初始容量扩为原来的2倍，这时，就需要一个一个复制原来的数据项了，这是比较费时的！所以，初始容量很重要。
以下是源码：
void addEntry(int hash, K key, V value, int bucketIndex) {
Entry<K,V> e = table[bucketIndex];
table[bucketIndex] = new Entry<K,V>(hash, key, value, e);
if (size++ >= threshold)
resize(2 * table.length); //扩容为2倍
}
void resize(int newCapacity) {
Entry[] oldTable = table;
int oldCapacity = oldTable.length;
if (oldCapacity == MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return;
}

Entry[] newTable = new Entry[newCapacity];
transfer(newTable);
table = newTable;
threshold = (int)(newCapacity * loadFactor);
}

HashMap中有加载因子loadFactor意义
当HashMap中的元素个数超过数组大小*loadFactor时，就会进行数组扩容，loadFactor的默认值为0.75，这是一个折中的取值。也就是说，默认情况下，数组大小为16，那么当HashMap中元素个数超过16*0.75=12的时候，就把数组的大小扩展为 2*16=32，即扩大一倍，然后重新计算每个元素在数组中的位置，而这是一个非常消耗性能的操作，所以如果我们已经预知HashMap中元素的个数，那么预设元素的个数能够有效的提高HashMap的性能。