HashSet、TreeSet、LinkedHashSet的区别

最新推荐文章于 2024-03-23 12:00:00 发布

翻译最新推荐文章于 2024-03-23 12:00:00 发布 · 5.4k 阅读

文章标签：

#Java #Set #TreeSet #HashSet #LinkedHashSet

Java 专栏收录该内容

11 篇文章

订阅专栏

本文深入解析了HashSet, TreeSet, LinkedHashSet三种集合类的特点与使用场景，通过代码实例展示了它们在实现顺序、性能和排序方面的区别，并通过性能测试验证了HashSet在添加操作上的优势。

原文链接：HashSet vs. TreeSet vs. LinkedHashSet

在一个set中，是没有重复元素的。这也是使用set最主要的原因之一。Set的实现类有三个：HashSet，TreeSet，LinkedHashSet。什么时候使用哪一种实现类，是一个非常的问题。简单地说，如果我们想要一个快速的set，那么我们应该使用HashSet；如果我们需要一个已经排好序的set，那么TreeSet应该被使用；如果我们想一个可以根据插入顺序来读取的set，那么LinkedHashSet应该被使用。

1.Set接口

Set接口继承了Collection接口。在set中，不允许有重复的元素。每一个元素在set中都是唯一的。我们可以简单地添加元素至一个set中，最后，我们会得到一个自动删除重复元素的set。

2.HashSet vs. TreeSet vs. LinkedHashSet

HashSet 是使用一个哈希表实现的。元素是无序的。add、remove 及contains 方法的时间复杂度是一个常量 O(1)。

TreeSet 是使用一个树结构（算法书籍上的红黑树）来实现的。元素在set中被排好序，但是add、remove及contains方法的时间复杂度为O(log(n))。它提供了几个方法用来处理有序的set，比如first()，last()，headSet()，tailSet()等等。

LinkedHashSet介于HashSet与TreeSet之间。它由一个执行hash表的链表实现，因此，它提供顺序插入。基本方法的时间复杂度为O(1)。

3.TreeSet 例子

TreeSet<Integer> tree = new TreeSet<Integer>();
tree.add(12);
tree.add(63);
tree.add(34);
tree.add(45);
 
Iterator<Integer> iterator = tree.iterator();
System.out.print("Tree set data: ");
while (iterator.hasNext()) {
    System.out.print(iterator.next() + " ");
}

如下所示，输出是已排好序的：

Tree set data: 12 34 45 63

现在，我们来定义一个如下的Dog类：

class Dog {
	int size;
 
	public Dog(int s) {
		size = s;
	}
 
	public String toString() {
		return size + "";
	}
}

我们添加一些dog至TreeSet中，就像下面这样：

import java.util.Iterator;
import java.util.TreeSet;
 
public class TestTreeSet {
	public static void main(String[] args) {
		TreeSet<Dog> dset = new TreeSet<Dog>();
		dset.add(new Dog(2));
		dset.add(new Dog(1));
		dset.add(new Dog(3));
 
		Iterator<Dog> iterator = dset.iterator();
 
		while (iterator.hasNext()) {
			System.out.print(iterator.next() + " ");
		}
	}
}

编译没问题，但是出现运行时错误：

Exception in thread “main” java.lang.ClassCastException: collection.Dog cannot be cast to java.lang.Comparable
at java.util.TreeMap.put(Unknown Source)
at java.util.TreeSet.add(Unknown Source)
at collection.TestTreeSet.main(TestTreeSet.java:22)

因为TreeSet是有序的，Dog对象需要实现java.lang.Comparable的compareTo()方法（应该是先实现Comparable再重写compareTo()方法），就像下面这样：

class Dog implements Comparable<Dog>{
	int size;
 
	public Dog(int s) {
		size = s;
	}
 
	public String toString() {
		return size + "";
	}
 
	@Override
	public int compareTo(Dog o) {
	        return size - o.size;
	}
}

输出：

1 2 3

4.HashSet 例子

HashSet<Dog> dset = new HashSet<Dog>();
dset.add(new Dog(2));
dset.add(new Dog(1));
dset.add(new Dog(3));
dset.add(new Dog(5));
dset.add(new Dog(4));
Iterator<Dog> iterator = dset.iterator();
while (iterator.hasNext()) {
	System.out.print(iterator.next() + " ");
}

输出：

5 3 2 1 4

注意：顺序是不确定的。

5.LinkedHashSet 例子

LinkedHashSet<Dog> dset = new LinkedHashSet<Dog>();
dset.add(new Dog(2));
dset.add(new Dog(1));
dset.add(new Dog(3));
dset.add(new Dog(5));
dset.add(new Dog(4));
Iterator<Dog> iterator = dset.iterator();
while (iterator.hasNext()) {
	System.out.print(iterator.next() + " ");
}

输出顺序是确定的，并且是按插入时的顺序。

2 1 3 5 4

6.性能测试

以下方法是测试三种类的add()方法的性能。

public static void main(String[] args) {
 
	Random r = new Random();
 
	HashSet<Dog> hashSet = new HashSet<Dog>();
	TreeSet<Dog> treeSet = new TreeSet<Dog>();
	LinkedHashSet<Dog> linkedSet = new LinkedHashSet<Dog>();
 
	// start time
	long startTime = System.nanoTime();
 
	for (int i = 0; i < 1000; i++) {
		int x = r.nextInt(1000 - 10) + 10;
		hashSet.add(new Dog(x));
	}
	// end time
	long endTime = System.nanoTime();
	long duration = endTime - startTime;
	System.out.println("HashSet: " + duration);
 
 
 
 
	// start time
	startTime = System.nanoTime();
 
	for (int i = 0; i < 1000; i++) {
		int x = r.nextInt(1000 - 10) + 10;
		treeSet.add(new Dog(x));
	}
	// end time
	endTime = System.nanoTime();
	duration = endTime - startTime;
	System.out.println("TreeSet: " + duration);
 
 
 
 
	// start time
	startTime = System.nanoTime();
 
	for (int i = 0; i < 1000; i++) {
		int x = r.nextInt(1000 - 10) + 10;
		linkedSet.add(new Dog(x));
	}
	// end time
	endTime = System.nanoTime();
	duration = endTime - startTime;
	System.out.println("LinkedHashSet: " + duration);
 
}

从下面的输出，我们可以清楚地看到HashSet是最快的。

HashSet: 2244768
TreeSet: 3549314
LinkedHashSet: 2263320