最近看了一篇关于HashMap的文章,讲的头头是道,我就自己阅读了一遍HashMap的源码!受益匪浅!今天就总结了一下HashMap
HashMap就是一个hash存储的数据结构,通过key.hashCode() & size 得到存储的地址,table是一个Entry[]的对象,table[i]是一个Entry的对象,Entry是一个链表结构,存储了key,value,next和h (hashCode),每次put进去的时候会检查存储位置是否存在,如果存在就把Entry加到列表的前头,然后检查容量,如果threshold的值就从新申请一倍的空间,重新计算每个key、value的位置。这个时候原来Entry的列表会打散,可能就不是在一个Entry的列表了。
有几个注意点:
1. key的hashCode一定需要保证不能变,如果变了需要重算Hash值,需要先从Map删掉,从新再添加一遍!保证下次添加可以顺利找到key值。
2. 尽量前期预估Map的大小,因为每次resize的操作,需要把所有的key、value重新算一遍,map越大,耗时越多。
为什么取存储位置要用key.hashCode() & size ,而教科书上面都是用key.hashCode() % size,因为%可以使分布更加均匀,避免冲突加剧,而&符号,size不合理会导致问题很严重!我猜想用&主要是考虑执行效率问题,写了段代码测试了一下:
public class TestHash {
public static void main(String[] args) {
long start = 0l;
long end = 0l;
int base = 256 - 1;
int result = 0;
int total = 0;
start = System.currentTimeMillis();
for (int i = 0; i < Integer.MAX_VALUE; i++) {
result = i % base;
total %= result + 1;
}
end = System.currentTimeMillis();
System.out.println(end - start);
total = 0;
start = System.currentTimeMillis();
for (int i = 0; i < Integer.MAX_VALUE; i++) {
result = i & base;
total &= result;
}
end = System.currentTimeMillis();
System.out.println(end - start);
System.out.println(total);
}
}
输出是:
14573
800
0
效率相差了18倍!