HashMap的底层是基于数组+链接的一个复合数据结构,非同步的 允许null键值 继承于map接口来实现,通过put和get方法来进行数据的操作.数组被分为一个个的bucket.哈希值决定了键值对在数组中的位置.具有相同哈希值的键值对会组成链表,当链表长度超过阀值(8)的时候回触发树化,链表转换成红黑树.
HashMap有几个关键变量:1,initialCapacity 初始化容量,就是hashmap的初始化的存储空间大小,可以在构造方法里指定,默认是16.一般是2幂次方, 在hashmap的构造函数中限制了初始化容量是2的n次方.在利用hash码计算数组的索引时,一般是用%的方式但这个效率比较低,按位运算特别快. 2,loadFactor 负载因子 hashmap存储容量满百分之七十五之后,会进行扩容操作, 增倍
源码解析:put和get方法
public V put(K key, V value) {
if (table == EMPTY_TABLE) {
inflateTable(threshold);
}
if (key == null)
return putForNullKey(value);
int hash = sun.misc.Hashing.singleWordWangJenkinsHash(key);
int i = indexFor(hash, table.length);
for (HashMapEntry<K,V> e = table[i]; e != null; e = e.next) {
Object k;
if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
V oldValue = e.value;
e.value = value;
e.recordAccess(this);
return oldValue;
}
}
modCount++;
addEntry(hash, key, value, i);
return null;
}
put(key,value)方法存储键值对对象到hashmap中,首先会通过hashcode方法计算hash值,然后寻址到map中bucket位置,如果hash值相同就以链表的形式存在bucket后,如果链表长度超过阀值就会转化成红黑树.如果数组长度超过阀值,就调用resize方法扩展容量.
get(key)方法获取存储在hashmap中的值.也是先获取hash值寻址到bucket的key相等就直接返回,如果发生hash碰撞,有两种情况,如果是树 就调用getTreenode获取value. 如果是链表就遍历链表查找对应的value
resize方法 将数组扩展位原来的两倍. 重新计算index索引值,将原节点重新放到新的数组中.这样也可以把原来冲突的节点分散到新的bucket中
当重新调整hashmap的大小时会存在线程条件竞争的问题,如果两个线程都发现hashmap需要重新调整大小,它们会同时试着调整大小.存储在链表中的次序会反过来,hashmap会将元素放到链表头部,避免尾部遍历. 如果条件竞争发生,就死循环了. 因为hashmap是非线程同步的, 多线程环境中考虑使用hashtable和ConcurrentHashMap
ConcurrentHashMap和hashmap的实现思路基本相同,也可以说是支持并发操作的hashmap!
ok 关于hashmap的总结大概就这些了. .