Java集合类的学习(四)——Set

1.5        Set

1.5.1        概述

Java 中的Set和正好和数学上直观的集(set的概念是相同的。Set最大的特性就是不允许在其中存放的元素是重复的。根据这个特点,我们就可以使用Set 这个接口来实现前面提到的关于商品种类的存储需求。Set 可以被用来过滤在其他集合中存放的元素,从而得到一个没有包含重复新的集合。

1.5.2        常用方法

按照定义,Set 接口继承 Collection 接口,而且它不允许集合中存在重复项。所有原始方法都是现成的,没有引入新方法。具体的 Set 实现类依赖添加的对象的 equals() 方法来检查等同性。

我们简单的描述一下各个方法的作用:

u     public int size() :返回set中元素的数目,如果set包含的元素数大于Integer.MAX_VALUE,返回Integer.MAX_VALUE 

u     public boolean isEmpty() :如果set中不含元素,返回true 

u     public boolean contains(Object o) :如果set包含指定元素,返回true 

u     public Iterator iterator()

l         返回set中元素的迭代器 

l         元素返回没有特定的顺序,除非set是提高了该保证的某些类的实例 

u     public Object[] toArray() :返回包含set中所有元素的数组 

u     public Object[] toArray(Object[] a) :返回包含set中所有元素的数组,返回数组的运行时类型是指定数组的运行时类型 

u     public boolean add(Object o) :如果set中不存在指定元素,则向set加入

u     public boolean remove(Object o) :如果set中存在指定元素,则从set中删除 

u     public boolean removeAll(Collection c) :如果set包含指定集合,则从set中删除指定集合的所有元素 

u     public boolean containsAll(Collection c) :如果set包含指定集合的所有元素,返回true。如果指定集合也是一个set,只有是当前set的子集时,方法返回true 

u     public boolean addAll(Collection c) :如果set中中不存在指定集合的元素,则向set中加入所有元素 

u     public boolean retainAll(Collection c) :只保留set中所含的指定集合的元素(可选操作)。换言之,从set中删除所有指定集合不包含的元素。 如果指定集合也是一个set,那么该操作修改set的效果是使它的值为两个set的交集 

u     public boolean removeAll(Collection c) :如果set包含指定集合,则从set中删除指定集合的所有元素 

u     public void clear() :从set中删除所有元素 

“集合框架” 支持 Set 接口两种普通的实现:HashSet 和 TreeSet以及LinkedHashSet。下表中是Set的常用实现类的描述:

 

 

简述 

实现

操作特性 

成员要求 

Set 

成员不能重复 

HashSet

外部无序地遍历成员。 

成员可为任意Object子类的对象,但如果覆盖了equals方法,同时注意修改hashCode方法。 

TreeSet

外部有序地遍历成员; 

附加实现了SortedSet, 支持子集等要求顺序的操作 

成员要求实现Comparable接口,或者使用Comparator构造TreeSet。成员一般为同一类型。 

LinkedHashSet

外部按成员的插入顺序遍历成员 

成员与HashSet成员类似 

 

在更多情况下,您会使用 HashSet 存储重复自由的集合。同时HashSet中也是采用了Hash算法的方式进行存取对象元素的。所以添加到 HashSet 的对象对应的类也需要采用恰当方式来实现 hashCode() 方法。虽然大多数系统类覆盖了 Object 中缺省的 hashCode() 实现,但创建您自己的要添加到 HashSet 的类时,别忘了覆盖 hashCode()。

对于Set的使用,我们先以一个简单的例子来说明: 

import java.util.*;

public class HashSetDemo {

public static void main(String[] args) {

Set set1 = new HashSet();

if (set1.add("a")) {//添加成功

System.out.println("1 add true");

}

if (set1.add("a")) {//添加失败

System.out.println("2 add true");

}

set1.add("000");//添加对象到Set集合中

set1.add("111");

set1.add("222");

System.out.println("集合set1的大小:"+set1.size());

System.out.println("集合set1的内容:"+set1);

set1.remove("000");//从集合set1中移除掉 "000" 这个对象

System.out.println("集合set1移除 000 后的内容:"+set1);

System.out.println("集合set1中是否包含000 "+set1.contains("000"));

System.out.println("集合set1中是否包含111 "+set1.contains("111"));

Set set2=new HashSet();

set2.add("111");

set2.addAll(set1);//set1 集合中的元素全部都加到set2

System.out.println("集合set2的内容:"+set2);

set2.clear();//清空集合 set1 中的元素

System.out.println("集合set2是否为空 "+set2.isEmpty());

Iterator iterator = set1.iterator();//得到一个迭代器

while (iterator.hasNext()) {//遍历

Object element = iterator.next();

System.out.println("iterator = " + element);

}

//将集合set1转化为数组

Object s[]= set1.toArray();

for(int i=0;i<s.length;i++){

System.out.println(s[i]);

}

}

}

程序执行的结果为:

1 add true

集合set1的大小:4

集合set1的内容:[222, a, 000, 111]

集合set1移除 000 后的内容:[222, a, 111]

集合set1中是否包含000 :false

集合set1中是否包含111 :true

集合set2的内容:[222, a, 111]

集合set2是否为空 :true

iterator = 222

iterator = a

iterator = 111

222

a

111

从上面的这个简单的例子中,我们可以发现,Set中的方法与直接使用Collection中的方法一样。唯一需要注意的就是Set中存放的元素不能重复。

我们再看一个例子,来了解一下其它的Set的实现类的特性:

package c08;

import java.util.*;

public class SetSortExample {

  public static void main(String args[]) {

    Set set1 = new HashSet(); 

    Set set2 = new LinkedHashSet();

    for(int i=0;i<5;i++){

     //产生一个随机数,并将其放入Set

     int s=(int) (Math.random()*100);

      set1.add(new Integer( s));

      set2.add(new Integer( s));

      System.out.println(" "+i+次随机数产生为:"+s);

    }

    System.out.println("未排序前HashSet"+set1);

    System.out.println("未排序前LinkedHashSet"+set2);

    //使用TreeSet来对另外的Set进行重构和排序

    Set sortedSet = new TreeSet(set1);

    System.out.println("排序后 TreeSet "+sortedSet);

  }

}

该程序的一次执行结果为:

第 0 次随机数产生为:96

第 1 次随机数产生为:64

第 2 次随机数产生为:14

第 3 次随机数产生为:95

第 4 次随机数产生为:57

未排序前HashSet:[64, 96, 95, 57, 14]

未排序前LinkedHashSet:[96, 64, 14, 95, 57]

排序后 TreeSet :[14, 57, 64, 95, 96]

从这个例子中,我们可以知道HashSet的元素存放顺序和我们添加进去时候的顺序没有任何关系,而LinkedHashSet 则保持元素的添加顺序。TreeSet则是对我们的Set中的元素进行排序存放。

一般来说,当您要从集合中以有序的方式抽取元素时,TreeSet 实现就会有用处。为了能顺利进行,添加到 TreeSet 的元素必须是可排序的。 而您同样需要对添加到TreeSet中的类对象实现 Comparable 接口的支持。对于Comparable接口的实现,在前一小节的Map中已经简单的介绍了一下。我们暂且假定一棵树知道如何保持 java.lang 包装程序器类元素的有序状态。一般说来,先把元素添加到 HashSet,再把集合转换为 TreeSet 来进行有序遍历会更快。这点和HashMap的使用非常的类似。

其实Set的实现原理是基于Map上面的。通过下面我们对Set的进一步分析大家就能更加清楚的了解这点了。

1.5.3         实现原理

Java中Set的概念和数学中的集合(set)一致,都表示一个集内可以存放的元素是不能重复的。

前面我们会发现,Set中很多实现类和Map中的一些实现类的使用上非常的相似。而且前面再讲解Map的时候,我们也提到:Map中的“键值对”,其中的“键”是不能重复的。这个和Set中的元素不能重复一致。我们以HashSet为例来分析一下,会发现其实Set利用的就是Map中“键”不能重复的特性来实现的。

先看看HashSet中的有哪些属性:

再结合构造函数来看看:

通过这些方法,我们可以发现,其实HashSet的实现,全部的操作都是基于HashMap来进行的。我们看看是如何通过HashMap来保证我们的HashSet的元素不重复性的:

看到这个操作我们可以发现HashSet的巧妙实现:就是建立一个“键值对”,“键”就是我们要存入的对象,“值”则是一个常量。这样可以确保,我们所需要的存储的信息之是“键”。而“键”在Map中是不能重复的,这就保证了我们存入Set中的所有的元素都不重复。而判断是否添加元素成功,则是通过判断我们向Map中存入的“键值对”是否已经存在,如果存在的话,那么返回值肯定是常量:PRESENT ,表示添加失败。如果不存在,返回值就为null 表示添加成功。

我们再看看其他的方法实现:

了解了这些后,我们就不难理解,为什么HashMap中需要注意的地方,在HashSet中也同样的需要注意。其他的Set的实现类也是差不多的原理。

至此对于Set我们就应该能够比较好的理解了。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值