Map是用于存储key-value映射对的容器。Java中常用的Map根据不同内部结构分有HashMap、LinkedHashMap和TreeMap,其中最常用的就是HashMap。
个人认为HashMap有三个要点
1.初始容量和加载因子
2.哈希算法
3.数据结构
初始容量和加载因子
当哈希表中的元素超过容量*加载因子时,数组会进行扩容,同时重哈希
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; //初始容量为16
static final float DEFAULT_LOAD_FACTOR = 0.75f;//加载因子
HashMap有三个构造器,当明确HashMap需要存放多少K-V对时,应当初始化容量,避免扩容和重哈希带来的开销
public HashMap()//默认构造器
public HashMap(int initialCapacity)//初始化容量
public HashMap(int initialCapacity, float loadFactor)//初始化容量和加载因子
hash算法
使用hashmap的put操作将键值对放入map中时,首先将根据Key计算哈希值,以确定键值对要放入的“桶”,也就是对应数组的下标。
当key为空时,哈希值等于0。否则,调用hashCode()函数得到h,值与key类是否重写hashCode()函数有关,无符号右移16位,也就是将底16位舍去,高16位变低16位,最后高16位全为0。因为1^0=1 、0^0=0 所以任何数与0异或就是它本身,当h小于2的16次时,最后结果就是h。
这样做的目的是添加扰动,hash桶的容量(初始16)相对于4个字节表示的int较小,计算存放位置的时候可能只用最后的几位,会造成频繁的哈希冲突
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
//此处有哈希值计算具体存放位置
if ((p = tab[i = (n - 1) & hash]) == null)
n为数组长度,且为2的m次方,m>=4,n初始为16,因此n-1的2进制为1111,hash & 1111相当于hash mod 16.
数据结构
HashMap的底层是数据的结构中的散列或者叫哈希表,并且使用分离连接法(拉链法)来解决哈希冲突,其本质就是数组加链表
//存储键值对的数组
transient Node<K,V>[] table;
//分装Key-Value的Node类
static class Node<K,V> implements Map.Entry<K,V> {
final int hash; //哈希值
final K key;//键
V value;//值
Node<K,V> next;//指向下一个节点,哈希冲突时会用到
.....
}
HashMap,put和get是最常用的方法之一,此处对put稍作分析,get方法相对简单
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;//如果tab为空,就调用resize分配,初始化tab,首次放入K-V对时,tab为空
if ((p = tab[i = (n - 1) & hash]) == null)
//如果要放入K-V的桶为空,直接放入
tab[i] = newNode(hash, key, value, null);
else {
Node<K,V> e; K k;
//如果key已经存在
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
//如果桶中存放的是树节点
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
//分离链接法解决哈希冲突
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
//当链表长度超过一定值时(默认为8),该桶内转换为红黑树
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
//如果key已经存在,跳出循环
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
//如果key已经存在,并且允许顶替旧value或者旧value为空。
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;//将旧值赋为新值
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
//当size超过容量和加载因子的乘积时
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
HashMap使用的数据结构其实是数组+链表+红黑树。
resize()函数代码太长就不贴了,主要功能是当table为空时,将其初始化,不为空时,将其容量变为原大小左移一位,也就是乘以2,因此也依然为2的n次方。同时要将原哈希表中的K-V重新存放到新哈希表中。
遍历是map的常用操作
Map<String,Integer> map=new HashMap<String,Integer>();
//常用的两次取值方法,但是效率较低
for(String key:map.keySet()){
System.out.println(map.get(key));
}
//同时遍历Key和Value
for(Map.Entry<String,Integer> entry:map.entrySet()){
System.out.println(entry.getKey()+entry.getValue());
}
//只遍历Value
for(Integer i:map.values()){
System.out.println(i);
}
//使用迭代器遍历
Iterator<Map.Entry<String, Integer>> it = map.entrySet().iterator();
while (it.hasNext()) {
Map.Entry<String, Integer> entry = it.next();
System.out.println( entry.getKey() + entry.getValue());
}