一.Map
Java集合中,List和set存储的都是单个值,而Map中存储的却是key-value对。
实现Map接口的类可以分为两种:基于Hash表的和基于RB-Tree的。
基于Hash表的主要是HashMap,该类具有Hash表的一些特点
1)集合中元素是无序的
2)操作时间复杂度为O(1)
3)可能要考虑hash冲突、hash表扩容的情况
4)允许key或value为null,但只能存在一个这样的元素
基于RB-Tree的主要是TreeMap,具有RB-Tree的一些特点:
1)由于插入到RB-Tree中会进行排序,因此集合中的元素都是有序的
2)操作的时间复杂度是O(lgn)
3)不允许null元素
下面将主要对HashMap的实现进行分析
二、HashMap的实现
Hash表有多种不同的实现方法,HashMap是采用“拉链法”实现的,即先是通过数组来实现。不同的元素经过hash()函数得到的值可能相同,因此可能还会产生冲突,冲突时则采用链表的形式解决。示意图如下:
1、基本属性
HashMap的基本属性如下所示:
public class HashMap<K,V>
extends AbstractMap<K,V>
implements Map<K,V>, Cloneable, Serializable
{
static final int DEFAULT_INITIAL_CAPACITY = 16;
static final int MAXIMUM_CAPACITY = 1 << 30;
static final float DEFAULT_LOAD_FACTOR = 0.75f;
final float loadFactor;
transient Entry<K,V>[] table; //存储元素的Hash表
transient int size;
int threshold;
transient int modCount;
static final int ALTERNATIVE_HASHING_THRESHOLD_DEFAULT = Integer.MAX_VALUE;
}
可以发现HashMap的容量为[16,2^30]
当未指定负载因子时,默认的loadfactor = DEFAULT_LOAD_FACTOR = 0.75f;
负载因子 = 已有元素个数 / HashMap的总容量 ,当负载因子过大时,则会导致一个数组元素的链表非常长,从而导致查找的效率非常低,此时则需要对HashMap进行扩容。
threshold为可存储的元素最大个数
table是存储所有key-value对的Hash数组,是真正存储数据的地方。
该数组中的每一个元素都是一个Entry,而Entry的基本结构如下
static class Entry<K,V> implements Map.Entry<K,V> {
final K key;
V value;
Entry<K,V> next;
int hash;
}
每一个Entry都包含一个key和value,以及计算后得到的hash值,并通过next引用来解决hash冲突。
2、构造与清除
如果对hash表有过了解的话,可以发现HashMap的实现与hash表基本相同