剖析 TreeMap 和 TreeSet


1. 剖析 TreeMap

1.1 TreeMap

TreeMap 首先继承了 AbstractMap 抽象类,表示它具有散列表的性质,也就是由 key-value 组成。其次 TreeMap 实现了 NavigableMap 接口,该接口支持一系列获取指定集合的导航方法,比如获取小于指定key的集合。最后分别实现 Serializable 接口以及 Cloneable 接口,分别表示支持对象序列化以及对象克隆。

TreeMap是基于红黑树实现的有序key-value集合,可以对元素进行自动排序,排序的规则可以是自然排序也可以是实现Comparable接口指定排序方式。

由于红黑树的查找、插入和删除的时间复杂度都是O(logn),所以TreeMap的查找、插入和删除等操作的时间复杂度也都是O(logn)。相比HashMap,TreeMap的优势是能够自动排序,适合在需要排序的场景下使用。HashMap适合在需要快速查找的场景下使用,而LinkedHashMap适合在即需要快速查找也需要排序的场景下使用。

TreeMap是非线程安全的,若有线程安全问题建议使用ConcurrentSkipListMap代替。它的iterator方法返回的迭代器是fail-fast的。

1.2 实现原理

TreeMap 内部是用红黑树实现的,红黑树是一种大致平衡的排序二叉树。

1.2.1 内部组成

TreeMap内部主要有以下成员:

private final Comparator<? super K> comparator;
private transient Entry<K,V> root;//root指向树的根节点
private transient int size = 0;//当前键值对的个数
private transient int modCount = 0;//记录树结构调整的次数,用来实现Fail-Fast 机制,如果在迭代这些集合的过程中,有其他线程修改了这些集合,就会抛出ConcurrentModificationException异常
//红黑树常量
private static final boolean RED   = false;
private static final boolean BLACK = true;

comparator 就是比较器,在构造方法中传递,如果没传,就是 null。Comparator 是用来维护 tree map 集合中的顺序,如果为null,则按照key的自然顺序。Comparator 是一个接口,排序时需要实现其 compare 方法,该方法返回正数,零,负数,它们分别代表大于,等于,小于。

root 指向树的根节点,从根节点可以访问到每个结点,结点的类型为 Entry。Entry 是 TreeMap 的一个内部类,其内部成员和构造方法为:

static final class Entry<K,V> implements Map.Entry<K,V> {
    K key;
    V value;
    Entry<K,V> left;
    Entry<K,V> right;
    Entry<K,V> parent;//对于根节点,其父节点为 null
    boolean color = BLACK;
    Entry(K key, V value, Entry<K,V> parent) {
        this.key = key;
        this.value = value;
        this.parent = parent;
    }
}

1.2.2 构造方法

TreeMap 中共有四个构造方法,其具体为:

//无参构造方法,将比较器 comparator 置为 null,表示按照key的自然顺序进行排序
public TreeMap() {
    comparator = null;
}
//带比较器的构造方法,需要自己实现Comparator
public TreeMap(Comparator<? super K> comparator) {
    this.comparator = comparator;
}
//构造包含指定map集合(无序)的元素,并且使用 自然排序 进行插入
public TreeMap(Map<? extends K, ? extends V> m) {
    comparator = null;
    putAll(m);
}
/**
* 带SortedMap的构造函数,和上面带Map的构造函数不一样,map是无序的,而SortedMap 是有序的
* 使用 buildFromSorted() 方法将SortedMap集合中的元素插入到TreeMap 中
*/
public TreeMap(SortedMap<K, ? extends V> m) {
    comparator = m.comparator();
    try {
        buildFromSorted(m.size(), m.entrySet().iterator(), null, null);
    } catch (java.io.IOException cannotHappen) {
    } catch (ClassNotFoundException cannotHappen) {
    }
}    

1.2.3 保存键值对

底层使用红黑树实现。需要添加元素的时候,这个key-value的元素中的key具备排序能力。因为当向TreeMap中添加元素的时候,需要首先按照key进行排序。如果key不具备排序能力则抛异常。下面我们来看一下添加元素时的源码,如下所示:

public V put(K key, V value) {
    Entry<K,V> t = root;
    /**
    * 如果根节点为空,则新建一个结点,设置 root 指向它,即新添加的元素为根节点
    * 并且设置集合的大小 size=1,以及 modCount+1
    */
    if (t == null) {
        compare(key, key); // type (and possibly null) check

        root = new Entry<>(key, value, null);
        size = 1;
        modCount++;//检测结构性变化
        return null;
    }
    /**
    * 如果不是第一次添加元素,则执行以下代码,添加的关键步骤是找寻父节点。
    * 寻找父节点根据是否设置了 comparator 分为两种情况
    */
    int cmp;
    Entry<K,V> parent;
    // split comparator and comparable paths
    Comparator<? super K> cpr = comparator;
    //如果设置了 comparator 进行以下操作
    if (cpr != null) {
    	//通过 do-while 循环不断遍历树,调用比较器对key进行比较
        do {
            parent = t;
            cmp = cpr.compare(key, t.key);
            if (cmp < 0)
                t = t.left;
            else if (cmp > 0)
                t = t.right;
            else
                //遇到key相等,直接将新值覆盖到原值上
                return t.setValue(value);
        } while (t != null);
        //当退出循环时,parent就指向待插结点的父节点
    }
    //没有 comparator 的情况(新插入的元素,按照key的自然排序)
    else {
    	//如果 key=null,直接抛出异常
		//注意:上面构造TreeMap传入了Comparator,是可以允许key为null的
        if (key == null)
            throw new NullPointerException();
        @SuppressWarnings("unchecked")
            Comparable<? super K> k = (Comparable<? super K>) key;
        do {
            parent = t;
            cmp = k.compareTo(t.key);
            if (cmp < 0)
                t = t.left;
            else if (cmp > 0)
                t = t.right;
            else
                return t.setValue(value);
        } while (t != null);
    }
    //找到父节点,根据父节点创建一个新节点
    Entry<K,V> e = new Entry<>(key, value, parent);
    if (cmp < 0)
        parent.left = e;
    else
        parent.right = e;
    //调整红黑树的结构,使其符合红黑树的约束,保持大致平衡
    fixAfterInsertion(e);
    size++;
    modCount++;
    return null;
}

这里,我们需要注意的是:在添加元素时,如果初始化TreeMap构造函数时,没有传递 Comparator 类,是不允许插入 key 为 null 的键值对的,相反,如果实现了Comparator,则可以传递 key 为 null 的键值对。
另外,上述代码中 compare(key,key),key 与 key 比较有何意义?我们看compare 方法的代码:

1.2.4 根据键获取值

//就是根据key找到对应的节点p,找到节点后获取值p.value
public V get(Object key) {
    Entry<K,V> p = getEntry(key);
    return (p==null ? null : p.value);
}

final Entry<K,V> getEntry(Object key) {
    // Offload comparator-based version for sake of performance
    //如果 comparator 不为null,调用单独的getEntryUsingComparator方法
    if (comparator != null)
        return getEntryUsingComparator(key);
        
    //如果 comparator 为 null(key实现了Comparable接口,使用该接口的compareTo方法进行比较)    
    //如果 key 为null,抛出异常
    if (key == null)
        throw new NullPointerException();
    //如果 key 不为 null
    @SuppressWarnings("unchecked")
    Comparable<? super K> k = (Comparable<? super K>) key;
    Entry<K,V> p = root;
    while (p != null) {
        int cmp = k.compareTo(p.key);
        if (cmp < 0)
            p = p.left;
        else if (cmp > 0)
            p = p.right;
        else
            return p;
    }
    return null;
}    

1.2.5 查看是否包含某个值

TreeMap 可以高效的按键进行查找,但如果要根据值进行查找,则需要遍历,其代码为:

public boolean containsValue(Object value) {
    for (Entry<K,V> e = getFirstEntry(); e != null; e = successor(e))
        //valEquals就是比较值,逐个进行比较
        if (valEquals(value, e.value))
            return true;
    return false;
}

//getFirstEntry 方法返回第一个节点
//第一个节点就是最左边的节点
final Entry<K,V> getFirstEntry() {
    Entry<K,V> p = root;
    if (p != null)
        while (p.left != null)
            p = p.left;
    return p;
}

//successor方法返回给定节点的后继
static <K,V> TreeMap.Entry<K,V> successor(Entry<K,V> t) {
    if (t == null)
        return null;
    else if (t.right != null) {//如果当前节点的右子树不为空
        Entry<K,V> p = t.right;
        while (p.left != null)
            p = p.left;
        return p;
    } else {//如果当前节点的右子树为空
        Entry<K,V> p = t.parent;
        Entry<K,V> ch = t;
        while (p != null && ch == p.right) {
            ch = p;
            p = p.parent;
        }
        return p;
    }
}

找后继的算法描述为:
(1)如果当前节点有有孩子,则后继结点为右子树中最小的节点
(2)如果当前节点没有右孩子,则其后继结点为该节点的某祖先节点。从当前节点开始向上找,如果它是父节点的右孩子,则继续找父节点,直到它不是右孩子或者父节点为空,第一个非右孩子节点的父亲节点就是后继节点,如果父节点为空,则后继结点为 null。

1.2.6 根据键删除键值对

在删除一个节点的时候,根据节点位置的不同,有不同的删除方法,下面介绍这三种情况:
(1)叶子节点:直接修改父节点对应的引用为 null 即可。
(2)只有一个孩子:在父亲节点和孩子节点之间直接建立链接
(3)有两个孩子:先找到后继节点,找到后,替换当前节点的内容为后继节点,然后再删除后继节点。因为这个后继节点一定没有左孩子,所以就将两个孩子的情况转换成了上面两种情况了。

//根据key找到节点,调用 deleteEntry 删除节点,返回原来的值
public V remove(Object key) {
    Entry<K,V> p = getEntry(key);
    if (p == null)
        return null;

    V oldValue = p.value;
    deleteEntry(p);
    return oldValue;
}
private void deleteEntry(Entry<K,V> p) {
    modCount++;
    size--;

    // If strictly internal, copy successor's element to p and then make p
    // point to successor.
    //如果左右孩子均不为空
    //		获取后继结点
    //		替换当前节点的内容为后继节点
    //		转换成一个孩子或者叶子节点的情况
    if (p.left != null && p.right != null) {
        Entry<K,V> s = successor(p);
        p.key = s.key;
        p.value = s.value;
        p = s;
    } // p has 2 children

	//有一个孩子的情况
    // Start fixup at replacement node, if it exists.
    Entry<K,V> replacement = (p.left != null ? p.left : p.right);
    if (replacement != null) {
        // Link replacement to parent 
        //在p的父节点和replacement之间建立链接
        replacement.parent = p.parent;
        if (p.parent == null)//p的父节点为空,则修改root指向新的根
            root = replacement;
        else if (p == p.parent.left)
            p.parent.left  = replacement;
        else
            p.parent.right = replacement;

        // Null out links so they are OK to use by fixAfterDeletion.
        p.left = p.right = p.parent = null;

        // Fix replacement 重新平衡树
        if (p.color == BLACK)
            fixAfterDeletion(replacement);
    } else if (p.parent == null) { // //如果树中只有一个根节点
        root = null;
    } else { //  No children. Use self as phantom replacement and unlink.
        if (p.color == BLACK)
            fixAfterDeletion(p);
        if (p.parent != null) {
            if (p == p.parent.left)
                p.parent.left = null;
            else if (p == p.parent.right)
                p.parent.right = null;
            p.parent = null;
        }
    }
}

1.3 总结

TreeMap 实现了 Map 接口,内部使用红黑树实现,红黑树是统计效率比较高的大致平衡的排序二叉树,这决定了它有如下特点:
(1)按键有序,TreeMap 同样实现了 SortedMap 和 NavigableMap 接口,可以方便的根据键的顺序进行查找,如第一个、最后一个、某一范围的键、临近键等。
(2)为了按键有序,TreeMap 要求键实现 Comparable 接口或者通过构造方法提供一个 Comparator 对象。
(3)根据键保存、查找、删除的效率比较高,为 O(h),h 为树的高度。
在应用中,如何取舍 HashMap 和 TreeMap 的使用?
不要求排序,优先考虑 HashMap;要求排序,考虑 TreeMap。

2. 剖析TreeSet

HashSet底层是通过HashMap实现的,TreeSet 底层也是通过 TreeMap 实现的。

2.1 TreeSet

TreeSet 的作用是保存无重复的数据,不过还对这些数据进行了排序。TreeMap的底层是通过红黑树实现的,所以TreeSet底层也是通过红黑树实现的。TreeSet 最主要的特点就是对元素进行了排序。我们对其特点进行总结一下:

(1)TreeSet 是基于TreeMap 的 NavigableSet 实现。

(2)TreeSet 的元素存储在 TreeMap 中的 key 中,TreeMap 的 value 是一个常量对象。

(3)非线程安全 。

(4)Java 8 新增分割器 spliterator() 方法。

2.2 实现原理

1.2.1 内部组成

//The backing map
private transient NavigableMap<E,Object> m;//TreeMap实现了NavigableMap接口
// Dummy value to associate with an Object in the backing Map
private static final Object PRESENT = new Object();

1.2.2 构造方法

//Constructs a set backed by the specified navigable map
TreeSet(NavigableMap<E,Object> m) {
    this.m = m;
}
/**
Constructs a new, empty tree set, sorted according to the natural ordering of its elements. 
All elements inserted into the set must implement the {@link Comparable} interface.
*/
public TreeSet() {
    this(new TreeMap<E,Object>());
}
/**
Constructs a new, empty tree set, sorted according to the specified comparator.  
All elements inserted into the set must be <i>mutually comparable</i> by the specified comparator
*/
public TreeSet(Comparator<? super E> comparator) {
    this(new TreeMap<>(comparator));
}    
public TreeSet(Collection<? extends E> c) {
    this();
    addAll(c);
}    
public TreeSet(SortedSet<E> s) {
    this(s.comparator());
    addAll(s);
}    

1.2.3 添加元素

public boolean add(E e) {
    return m.put(e, PRESENT)==null;
}

就是调用 map 的 put 方法,元素 e 用作键,值就是固定值 PRESENT,put 返回 null 表示原来没有对应的键,添加成功了。

1.2.4 查看是否包含某个元素

public boolean contains(Object o) {
    return m.containsKey(o);
}

就是检查 map 中是否包含对应的键。

1.2.5 删除元素

public boolean remove(Object o) {
    return m.remove(o)==PRESENT;
}

调用 map 的 remove 方法,返回值为 PRESENT 表示原来有对应的键且删除成功了。

2.3 总结

在用法方面,它实现了 Set 接口,但有序;在内部实现上,它基于 TreeMap 实现,而 TreeMap 基于红黑树,这决定了它有如下特点:
(1)没有重复元素
(2)添加、删除元素、判断元素是否存在,效率比较高
(3)有序,TreeSet 同样实现了 SortedSet 接口,可以方便的根据顺序进行查找和操作,如第一个、最后一个、某一取值范围、某一值的邻近元素等
(4)为了有序,TreeSet 要求元素实现 Comparable 接口或者 通过构造方法提供一个 Comparator 对象

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值