作为一个稀有的Java妹子,所写的所有博客都只是当作自己的笔记,留下证据自己之前是有用心学习的~哈哈哈哈(如果有不对的地方,也请大家指出,不要悄悄咪咪的不告诉我)
HashMap
本文的分享是基于jdk1.8版本
1.数据结构
HashMap底层的数据结构是数组+链表,基本的数据单位是Node<K,V>,包括key,value,next。
HashMap以key的hash值为数组下标查找或添加元素,当不同的key有相同的hash值时,出现hash碰撞,就是说本来不同的key应该是对应不同的hash,那么就可以在数组的不同下标位置处存放各自的value,然而事实并不是想象中那么美好,所以出现碰撞时,需要在同一个下标位置存放两个元素,因为Node有next属性,只需把该位置元素的next指向新的元素就可以了。
static class Node<K,V> implements Map.Entry<K,V> {
final int hash;
final K key;
V value;
Node<K,V> next;
Node(int hash, K key, V value, Node<K,V> next) {
this.hash = hash;
this.key = key;
this.value = value;
this.next = next;
}
}
横向就是HashMap的数组结构,通常情况下,元素都是放在不同的下标位置处,纵向是链表结构,当发生hash碰撞时,就在该下标处生成链表结构。
2.成员变量
//数组,存放所有的元素
transient Node<K,V>[] table;
//默认的初始容量
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
//默认的负载因子
static final float DEFAULT_LOAD_FACTOR = 0.75f;
//获取一个Node<K,V>集合,包含HashMap中的所有元素
transient Set<Map.Entry<K,V>> entrySet;
//hashMap的大小
transient int size;
//判断是否需要扩容的大小,阈值
int threshold;
//负载因子
final float loadFactor;
3.构造函数
//自定义初始化容量和负载因子
public HashMap(int initialCapacity, float loadFactor);
//自定义初始化容量,使用默认负载因子
public HashMap(int initialCapacity);
//使用默认初始化容量和默认的负载因子
public HashMap();
public HashMap(Map<? extends K, ? extends V> m);
4.put方法
HashMap不是在构造方法处初始化table的,而是在put元素的时候初始化table。
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
//判断table是否为空
if ((tab = table) == null || (n = tab.length) == 0)
//为空需要初始化table
n = (tab = resize()).length;
//计算key所在的下标位置是否有元素
if ((p = tab[i = (n - 1) & hash]) == null)
//没有元素的话,直接将传入的key,value存放到相应的位置
tab[i] = newNode(hash, key, value, null);
else {
Node<K,V> e; K k;
//判断传入的key与已存在的key是否相等
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
//把新的元素保存下来,将value更新
e = p;
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
//如果已有的元素key不等于新的,则需要把新的元素放到链表的尾部
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
//HaspMap中存在相同key,替换掉旧的value值
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
//将长度+1,并且判断长度是否超过了阈值
if (++size > threshold)
//扩容
resize();
afterNodeInsertion(evict);
return null;
}
总结:通过key的hash值找到数组下标处有没有元素存在,没有则直接把Node放进去,有的话判断该处元素的key与传入的key是否相等,相等则用传入的value替换旧的value,不相等则在当前下标位置处放入链表的尾部。
5.get方法
public V get(Object key) {
Node<K,V> e;
return (e = getNode(hash(key), key)) == null ? null : e.value;
}
final Node<K,V> getNode(int hash, Object key) {
Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
//判断数组下标为key的hash值处是否为null
if ((tab = table) != null && (n = tab.length) > 0 &&
(first = tab[(n - 1) & hash]) != null) {
//不为空则判断下标处元素的key与传入的key是否相等
if (first.hash == hash && // always check first node
((k = first.key) == key || (key != null && key.equals(k))))
//相等就返回
return first;
if ((e = first.next) != null) {
if (first instanceof TreeNode)
return ((TreeNode<K,V>)first).getTreeNode(hash, key);
do {
//不相等时,循环链表,直到找到相同key的元素
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
return e;
} while ((e = e.next) != null);
}
}
return null;
}
总结:先根据key的hash值找数组下标,如果为null,直接返回null;不为空,则判断当前元素的key是否与传入的key相等,相等则返回,不相等则循环该处的链表,直到找到相等的key。
6.resize方法
为什么需要扩容呢?因为当HashMap的元素越来越多时,发生碰撞的几率也会变大,链表会越来越多,查询和添加的效率也会变慢。所以当元素个数超过阈值就会调用resize扩容方法。注意这里的元素个数不是size,是容量*loadFactor,如果容量为16,loadFactor为0.75,那么当size>12时就会触发扩容机制。
扩容是把容量扩大两倍,然后把原来的元素重新计算hash值放入新的HashMap中,这个过程比较耗时,所以能提前预知集合大小的,尽量初始化大小。
7.其他的常用方法
//是否存在key
public boolean containsKey(Object key) {
return getNode(hash(key), key) != null;
}
//是否存在value
public boolean containsValue(Object value) {
Node<K,V>[] tab; V v;
if ((tab = table) != null && size > 0) {
for (int i = 0; i < tab.length; ++i) {
for (Node<K,V> e = tab[i]; e != null; e = e.next) {
if ((v = e.value) == value ||
(value != null && value.equals(v)))
return true;
}
}
}
return false;
}
//获取所有的value值
public Collection<V> values() {
Collection<V> vs = values;
if (vs == null) {
vs = new Values();
values = vs;
}
return vs;
}
8.循环HashMap
使用entrySet()方法可以一次性获取所有的key和value,不用循环获取value,提升效率。
public static void main(String[] args) {
Map<String,String> map = new HashMap<>(8);
map.put("1","hhh");
map.put("2","rrr");
map.put("3","uuu");
for(Map.Entry<String,String> entry:map.entrySet()){
System.out.println("key:"+entry.getKey()+",value:"+entry.getValue());
}
}
结果:
key:1,value:hhh
key:2,value:rrr
key:3,value:uuu
9 HashMap与HashTable的异同
1.相同点:
两个都是基于哈希表实现的,每个元素是Key-value对,内部都是采用链表来解决冲突问题,容量不足时会自动扩容
2.不同点:
HashMap是线程不安全的,HashTable是线程安全的
HashMap的key和value都支持null,而HashTable的key和value不支持null
10 HashMap和LinkedHashMap的异同
1.相同点
两个都是基于哈希表实现的,每个元素是Key-value对,内部都是采用链表来解决冲突问题,容量不足时会自动扩容
2.不同点
HashMap是无序的,LinkedHashMap是有序的
注意:
1.因为HashMap的key和value都可以是null,所以使用get方法得到null,可能是不存在key,也可能是本来value就是null,所以判断HashMap里是否有某个键,应该使用containsKey