是否在面试时老被问到HashMap的问题,那么来一次了断吧^_^
基本的诸如HashMap是否属于Collection接口就不谈了,来点深入的
HashMap的数据结构用的是什么?
数组 + 链表
以下为HashMap的源码:
transient Entry[] table; //数组
public HashMap() {
this.loadFactor = DEFAULT_LOAD_FACTOR;
threshold = (int)(DEFAULT_INITIAL_CAPACITY * DEFAULT_LOAD_FACTOR);
table = new Entry[DEFAULT_INITIAL_CAPACITY];
init();
}
static class Entry<K,V> implements Map.Entry<K,V> {
final K key;
V value;
Entry<K,V> next;
final int hash;
其中,table为数组,Entry为链表
HashMap的实现方法
再来看下get方法的实现,先看源码:
public V get(Object key) {
if (key == null)
return getForNullKey();
int hash = hash(key.hashCode()); //计算出key的hash值
for (Entry<K,V> e = table[indexFor(hash, table.length)]; //hash值除以数组的长度
e != null;
e = e.next) {
Object k;
if (e.hash == hash && ((k = e.key) == key || key.equals(k)))
return e.value;
}
return null;
}
static int indexFor(int h, int length) {
return h & (length-1); //hash值除以数组的长度-1
}
如何解决hash冲突方法:
开放地址法:
eg: 比 如<1,2>已经存在table数组的31的位置上了,再来一个<101,102>,其通过哈希后说:我也应该在31的位置上, 但是table说,你后来,你再在31附近找个空位安置下吧。当然,具体怎么找,有规则的
链地址法:
eg: <101,102>来到时,发现31的位置已经被占了,这时table说:<1,2>,你带 下<101,102>;其实就是要<1,2>把<101,102>的引用存储了。但是<1,2>说:我 怎么存储<101,102>的引用了,我没位置呀。这是为什么entry类是链表的原因
比较:
开放地址法一般需要2倍实际数据大小的空间,因为要留下一定的空闲地址去存储相 同hashCode的<key,value>;并且查找相邻空闲地址也是一项比较费时间的任务;链地址法,就不需要2倍的空间(table数 组),但是需要存储额外的信息,比如next信息;总体来看,链地址法好点(关键是节省了查找相邻地址的时间)
hashMap用的是链地址法。
hashMap在每次插入数据前,会检查table数组的实际容量,如果实际容量>=初始容量,则把 table的初始容量扩为原来的2倍,这时,就需要一个一个复制原来的数据项了,这是比较费时的!所以,初始容量很重要。
以下是源码:
void addEntry(int hash, K key, V value, int bucketIndex) {
Entry<K,V> e = table[bucketIndex];
table[bucketIndex] = new Entry<K,V>(hash, key, value, e);
if (size++ >= threshold)
resize(2 * table.length); //扩容为2倍
}
void resize(int newCapacity) {
Entry[] oldTable = table;
int oldCapacity = oldTable.length;
if (oldCapacity == MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return;
}
Entry[] newTable = new Entry[newCapacity];
transfer(newTable);
table = newTable;
threshold = (int)(newCapacity * loadFactor);
}
HashMap中有加载因子loadFactor意义
当HashMap中的元素个数超过数组大小*loadFactor时,就会进行数组扩容,loadFactor的默认值为0.75,这是一个折中的取值。也就是说,默认情况下,数组大小为16,那么当HashMap中元素个数超过16*0.75=12的时候,就把数组的大小扩展为 2*16=32,即扩大一倍,然后重新计算每个元素在数组中的位置,而这是一个非常消耗性能的操作,所以如果我们已经预知HashMap中元素的个数,那么预设元素的个数能够有效的提高HashMap的性能。