HashSet、TreeSet、LinkedHashSet三者比较

翻译 2013年12月04日 19:26:16

    Set中不能有重复的元素,这是使用Set的主要原因之一。Set接口主要有三种实现:HashSet、TreeSet和LinkedHashSet。如何挑选一个合适的Set实现类是很重要的。简单来说,如果我们对速度的要求较高,可以使用HashSet;如果我们需要一个可排序的Set,则应该选用TreeSet;如果我们需要一个可根据插入顺序来进行元素读取的Set,则应使用LinkedHashSet。

1. Set接口

    Set接口继承了Collection接口。Set接口中不允许有重复的元素,每一个元素在Set都应该是唯一的。我们可以简单地将元素添加至一个set,然后我们就能得到一个元素集合,该集合中重复的元素已经被自动移除了。


2. HashSet、TreeSet和LinkedHashSet

    HashSet是使用哈希表(hash table)实现的,其中的元素是无序的。HashSet的addremovecontains方法 的时间复杂度为常量O(1)。

    TreeSet使用树形结构(算法书中的红黑树red-black tree)实现的。TreeSet中的元素是可排序的,但addremovecontains方法的时间复杂度为O(log(n))。TreeSet还提供了first()、last()、headSet()、tailSet()等方法来操作排序后的集合。

    LinkedHashSet介于HashSet和TreeSet之间。它基于一个由链表实现的哈希表,保留了元素插入顺序。LinkedHashSet中基本方法的时间复杂度为O(1)。

3. TreeSet示例

TreeSet<Integer> tree = new TreeSet<Integer>();
tree.add(12);
tree.add(63);
tree.add(34);
tree.add(45);
 
Iterator<Integer> iterator = tree.iterator();
System.out.print("Tree set data: ");
while (iterator.hasNext()) {
    System.out.print(iterator.next() + " ");
}

    输出排序后的结果如下:

Tree set data: 12 34 45 63
    现在,我们定义一个Dog类,如下:

class Dog {
    int size;
 
    public Dog(int s) {
        size = s;
    }
 
    public String toString() {
        return size + "";
    }
}

   然后,我们将一些Dog对象添加入TreeSet,如下所示:

import java.util.Iterator;
import java.util.TreeSet;
 
public class TestTreeSet {
    public static void main(String[] args) {
        TreeSet<Dog> dset = new TreeSet<Dog>();
        dset.add(new Dog(2));
        dset.add(new Dog(1));
        dset.add(new Dog(3));
 
       Iterator<Dog> iterator = dset.iterator();
 
        while (iterator.hasNext()) {
        System.out.print(iterator.next() + " ");
        }
    }
}
    编译成功,但出现运行时错误:

Exception in thread “main” java.lang.ClassCastException: collection.Dog cannot be cast to java.lang.Comparable
at java.util.TreeMap.put(Unknown Source)
at java.util.TreeSet.add(Unknown Source)
at collection.TestTreeSet.main(TestTreeSet.java:22)
    这是因为TreeSet是可排序的,Dog对象需要实现java.lang.Comparable接口的compareTo()方法,如下所示:

class Dog implements Comparable<Dog>{
    int size;
 
    public Dog(int s) {
        size = s;
    }
 
    public String toString() {
        return size + "";
    }
 
    @Override
    public int compareTo(Dog o) {
        return size - o.size;
    }
}
    输出的结果如下:

1 2 3

4. HashSet示例

HashSet<Dog> dset = new HashSet<Dog>();
dset.add(new Dog(2));
dset.add(new Dog(1));
dset.add(new Dog(3));
dset.add(new Dog(5));
dset.add(new Dog(4));
Iterator<Dog> iterator = dset.iterator();
while (iterator.hasNext()) {
    System.out.print(iterator.next() + " ");
}
    输出结果如下:

5 3 2 1 4
   注意输出的顺序是不确定的。

5. LinkedHashSet示例

LinkedHashSet<Dog> dset = new LinkedHashSet<Dog>();
dset.add(new Dog(2));
dset.add(new Dog(1));
dset.add(new Dog(3));
dset.add(new Dog(5));
dset.add(new Dog(4));
Iterator<Dog> iterator = dset.iterator();
while (iterator.hasNext()) {
    System.out.print(iterator.next() + " ");
}
    输出的结果是确定的,和插入的顺序一致。
2 1 3 5 4

6. 性能测试

    下面的方法用于测试上述三个类中add()方法的性能。

public static void main(String[] args) {

    Random r = new Random();
 
    HashSet<Dog> hashSet = new HashSet<Dog>();
    TreeSet<Dog> treeSet = new TreeSet<Dog>();
    LinkedHashSet<Dog> linkedSet = new LinkedHashSet<Dog>();
 
    // start time
    long startTime = System.nanoTime();
 
    for (int i = 0; i < 1000; i++) {
        int x = r.nextInt(1000 - 10) + 10;
        hashSet.add(new Dog(x));
    }
    // end time
    long endTime = System.nanoTime();
    long duration = endTime - startTime;
    System.out.println("HashSet: " + duration);


    // start time
    startTime = System.nanoTime();
 
    for (int i = 0; i < 1000; i++) {
        int x = r.nextInt(1000 - 10) + 10;
        treeSet.add(new Dog(x));
    }
    // end time
    endTime = System.nanoTime();
    duration = endTime - startTime;
    System.out.println("TreeSet: " + duration);


    // start time
    startTime = System.nanoTime();
 
    for (int i = 0; i < 1000; i++) {
        int x = r.nextInt(1000 - 10) + 10;
        linkedSet.add(new Dog(x));
    }
    // end time
    endTime = System.nanoTime();
    duration = endTime - startTime;
    System.out.println("LinkedHashSet: " + duration);
}
    从下面的输出结果中,我们可以清楚地看出,HashSet的add()方法速度最快。

HashSet: 2244768
TreeSet: 3549314
LinkedHashSet: 2263320

原文地址:HashSet vs. TreeSet vs. LinkedHashSet

HashSet TreeSet LinkedHashSet 区别

set不包含重复的元素,这也是使用set的一个主要原因,set有三个常用的实现,分别是HashSet、TreeSet和LinkedList。总之,对于这三个实现,何时使用是一个重要的问题,如果你需要一...

HashSet、LinkedHashSet和TreeSet三者区别与联系

一.HashSet 特点: 1.HashSet中不能有相同的元素,可以有一个Null元素,存入的元素是无序的。 2.HashSet如何保证唯一性? 1).HashSet底层数据结构是哈希表,哈...
  • StemQ
  • StemQ
  • 2017年03月26日 19:34
  • 603

HashSet和HashMap的性能选项

对于HashSet及其子类而言,它们采用hash算法来决定集合中元素的存储位置,并通过hash算法来控制集合的大小; 对于HashMap、Hashtable及其子类而言,它们采用hash算法来觉得M...
  • OREO_GO
  • OREO_GO
  • 2016年09月14日 10:10
  • 1804

[JVM]Java内存区域与内存溢出异常

1 Java堆 2 方法区 3 程序计数器 4 Java虚拟机桟 1 局部变量表 2 操作数栈 3 动态连接 4 方法返回地址 5 本地方法桟 6 直接内存区Java内存区域可以分...

为什么红黑树的效率比较高

红黑树属于平衡二叉树。它不严格是因为它不是严格控制左、右子树高度或节点数之差小于等于1,但红黑树高度依然是平均log(n),且最坏情况高度不会超过2log(n)。 红黑树(red-black t...
  • seulzz
  • seulzz
  • 2017年08月20日 21:57
  • 114

HashSet,TreeSet 和 LinkedHashSet比较

一、Set回顾 一个不包括重复元素(包括可变对象)的Collection,是一种无序的集合。Set不包含满 a.equals(b) 的元素对a和b,并且最多有一个null。 泥瓦匠的记忆宫殿:...

示例比较HashSet,LinkedHashSet,TreeSet

import java.util.HashSet; import java.util.LinkedHashSet; import java.util.TreeSet; public class T0...
  • ISAMU
  • ISAMU
  • 2013年07月19日 01:37
  • 570

初学Java,比较HashSet,LinkedHashSet,TreeSet,EnumSet(二十七)

HashSet 集合存入元素时,会调用该对象的hashCode()方法得到hashCode值,根据hashCode值决定对象在HashSet中存储的位置,如有两个元素通过equals方法比较返回tru...
  • lee576
  • lee576
  • 2012年02月16日 22:23
  • 2924

HashSet,TreeSet和LinkedHashSet的区别

一、Set接口 Set不允许包含相同的元素,如果试图把两个相同元素加入同一个集合中,add方法返回false。 Set判断两个对象相同不是使用==运算符,而是根据equals方法。也就是说,只要两...

Collection List Set SortedSet ArrayList LinkedList HashSet LinkedHashSet TreeSet的认识及用法

package com.semovy.test; import java.util.ArrayList; import java.util.Arrays; import java.util.Co...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:HashSet、TreeSet、LinkedHashSet三者比较
举报原因:
原因补充:

(最多只允许输入30个字)