对Java中Set的深入研究

这篇文章主要论述了Set是如何实现"没有重复元素"(no duplicate elements)的,以及阐述了什么是“重复”(duplicate),是相同的地址空间?是equals的返回值为true?是compareTo的返回值为0 ?还是有相同的hashCode?本文还给出了在什么情况下使用什么样的Set的建议。

  注:本文不涉及范型。

  1、树形结构:

  public interface Set extends Collection{}
  public abstract class AbstractSet extends AbstractCollection implements Set{}
  public class CopyOnWriteArraySetextends AbstractSetimplements Serializable{}
  public abstract class EnumSet>extends AbstractSetimplements Cloneable, Serializable{}
  public class HashSetextends AbstractSetimplements Set, Cloneable, Serializable{}
  public final class JobStateReasonsextends HashSetimplements PrintJobAttribute{}
  public class LinkedHashSetextends HashSetimplements Set, Cloneable, Serializable{}
  public class TreeSetextends AbstractSetimplements SortedSet, Cloneable, Serializable{}

  可以看出,可以实例化的类为:CopyOnWriteArraySet,HashSet,LinkedHashSet,TreeSet。

  2、Set是如何实现元素唯一性的

  javadoc中对Set的描述第一段如下:“A collection that contains no duplicate elements. More formally, sets contain no pair of elements e1 and e2 such that e1.equals(e2), and at most one null element. As implied by its name, this interface models the mathematical set abstraction.”

  这段话是对是错,请看下面分析。

  要进行下面的论述,我们先了解一下Map。Map中的元素是“键-值”对,其中“键”必须是唯一的。TreeSet和HashSet就是利用这个特性实现“no duplicate elements”。它把set中的元素作为Map中的“键”,从而保持元素的唯一性。这些键在Map中又是如何区分的呢?不同的Map有不同的做法,而且区别很大。

  下面我们分别就TreeSet、HashSet和CopyOnWriteArraySet进行论述:

  2.1、TreeSet部分:

  以下以TreeSet为例进行分析。

  请看TreeSet的部分实体:

  public class TreeSet extends AbstractSet
  implements SortedSet, Cloneable, java.io.Serializable
  {
  // The backing Map

  private transient SortedMap m;
  // The keySet view of the backing Map

  private transient Set keySet;
  // Dummy value to associate with an Object in the backing Map
  //这是每个键所指的对像

  private static final Object PRESENT = new Object();
  //constructor

  private TreeSet(SortedMap m) {
  this.m = m;
  keySet = m.keySet();
  }
  public TreeSet() {
  this(new TreeMap());
  }
  //以下省略..........

  }

  可以看到TreeSet使用了SortedMap作为其Map保存“键-值”对,而这个SortedMap的真正实体是TreeMap。

  请看示例程序1:

  import java.util.*;
  public class SetTest1 {
  public static void main(String[] args){
  Set set = new TreeSet();
  set.add(new SetElement1("aa"));
  set.add(new SetElement1("bb"));
  }
  static class SetElement1{
  String s;
  public SetElement1(String s){
  this.s = s;
  }
  public String toString(){
  return s;
  }
  public boolean equals(Object obj) {
  return s.equals(((SetElement1)obj).s);
  }
  }
  }

  该程序能够正常编译,但是运行时会抛出异常java.lang.ClassCastException。为什么?

  请看示例程序2:

  import java.util.*;
  public class SetTest2 {
  public static void main(String[] args){
  Set set = new TreeSet();
  set.add(new SetElement2("aa"));
  set.add(new SetElement2("aa"));
  set.add(new SetElement2("bb"));
  System.out.println(set);
  }
  static class SetElement2 implements Comparable{
  String s;
  public SetElement2(String s){
  this.s = s;
  }
  public String toString(){
  return s;
  }
  public int compareTo(Object o){
  return s.compareTo(((SetElement2)o).s);
  }
  public boolean equals(Object obj) {
  return s.equals(((SetElement2)obj).s);
  }
  }
  }

  运行结果:

  [aa, bb]

  这正是我们所期望的结果。那“示例程序1”和“示例程序2”有什么区别?

  是因为SetElement2实现了Comparable接口,而SetElement1没有。SetElement2实现Comparable接口有什么用呢?因为在TreeSet的add方法中需要比较两个元素的“值”。请看TreeMap中的compare方法:

  private int compare(K k1, K k2) {
  return (comparator==null ? ((Comparable)k1).compareTo(k2) : comparator.compare((K)k1, (K)k2));
  }

  可见这个方法先把要比较的元素down cast成Comparable类型。这里就可以解释“示例程序1”中为什么会抛出异常java.lang.ClassCastException,因SetElement1没有实现Comparable接口,当然就不能down cast成Comparable。可见,要用TreeSet来做为你的Set,那么Set中所装的元素都必须实现了Comparable接口。

  说到这里,你是不是想到了TreeSet中是采用Comparable接口中的compareTo方法来判断元素是否相同(duplicate),而不是采用其他类似equals之类的东东来判断。

  请看示例程序3:

  import java.util.Set;
  import java.util.*;
  public class SetTest3 {
  public static void main(String[] args){
  Set set = new TreeSet();
  set.add(new SetElement3("aa"));
  set.add(new SetElement3("aa"));
  set.add(new SetElement3("bb"));
  System.out.println(set);
  }
  static class SetElement3 implements Comparable{
  String s;
  public SetElement3(String s){
  this.s = s;
  }
  public String toString(){
  return s;
  }
  public int compareTo(Object o){
  //return s.compareTo(((SetElement3)o).s);

  return -1;
  }
  public boolean equals(Object obj) {
  return s.equals(((SetElement3)obj).s);
  }
  }
  }

  运行结果:

  [bb, aa, aa]

  看到没有,有两个“aa”!!这是因为compareTo返回值始终是"-1",也就是说“把任何元素都看成不同”。

  综上所述,你是否对javadoc中对Set功能的描述有了怀疑?!

  2.2、HashSet部分:

  以下以HashSet为例进行分析。

  从Hashset类的主体部分:

  public class HashSet extends AbstractSet implements Set, Cloneable, java.io.Serializable
  {
  static final long serialVersionUID = -5024744406713321676L;
  private transient HashMap map;
  // Dummy value to associate with an Object in the backing Map
  //这是每个键所指的对像

  private static final Object PRESENT = new Object();
  public HashSet() {
  map = new HashMap();
  }
  public boolean add(E o) {
  return map.put(o, PRESENT)==null;
  }
  //以下省略..........

  }
  public HashSet() {
  map = new HashMap();
  }

  可以看到HashSet使用了HashMap作为其Map保存“键-值”对。

  请看示例程序4:

  import java.util.*;
  public class SetTest4 {
  public static void main(String[] args){
  Set set = new HashSet();
  set.add(new SetElement4("aa"));
  set.add(new SetElement4("aa"));
  set.add(new SetElement4("bb"));
  System.out.println(set);
  }
  static class SetElement4{
  String s;
  public SetElement4(String s){
  this.s = s;
  }
  public String toString(){
  return s;
  }
  public boolean equals(Object obj) {
  return s.equals(((SetElement4)obj).s);
  }
  }
  }

  运行结果:

  [bb, aa, aa]

  没有“示例程序1”中的java.lang.ClassCastException,但是运行结果似乎不对,因为有两个“aa”。

  请看示例程序5:

  import java.util.*;
  public class SetTest5 {
  public static void main(String[] args){
  Set set = new HashSet();
  set.add(new SetElement5("aa"));
  set.add(new SetElement5("aa"));
  set.add(new SetElement5("bb"));
  System.out.println(set);
  }
  static class SetElement5{
  String s;
  public SetElement5(String s){
  this.s = s;
  }
  public String toString(){
  return s;
  }
  public boolean equals(Object obj) {
  return s.equals(((SetElement5)obj).s);
  }
  public int hashCode() {
  //return super.hashCode();

  return s.hashCode();
  }
  }
  }

  运行结果:

  [bb, aa]

  这就对了。“示例程序4”和“示例程序5”有什么区别?是SetElement5重写了hashCode方法。

  可见HashSet中是采用了比较元素hashCode的方法来判断元素是否相同(duplicate),而不是采用其他类似equals之类的东东来判断。

  说了这么多,那java类库中到底有没有根据equals来判断元素是否相同(duplicate)的Set呢?请看下文。

  2.2、CopyOnWriteArraySet部分:

  类CopyOnWriteArraySet是java.util.concurrent包中的一个类,所以它是线程安全的。

  CopyOnWriteArraySet是使用CopyOnWriteArrayList作为其盛放元素的容器。当往CopyOnWriteArrayList添加新元素,它都要遍历整个List,并且用equals来比较两个元素是否相同。

  请看示例程序6:

  import java.util.*;
  import java.util.concurrent.*;
  public class SetTest6 {
  public static void main(String[] args){
  Set set = new CopyOnWriteArraySet();
  set.add(new SetElement6("aa"));
  set.add(new SetElement6("aa"));
  set.add(new SetElement6("bb"));
  System.out.println(set);
  }
  static class SetElement6{
  String s;
  public SetElement6(String s){
  this.s = s;
  }
  public String toString(){
  return s;
  }
  public boolean equals(Object obj) {
  return s.equals(((SetElement6)obj).s);
  }
  }
  }

  运行结果:

  [aa, bb]

  好了,一切搞定!!

  3、总结:

  Javadoc中的一些描述可能是不准确的,大家要当心了!

  Set中实现元素互异的各种方法差异很大,大致可以分为三种:使用equals,使用hashCode,使用compareTo。但是我还没有发现采用“判断地址空间是否相同”来判断元素是否相同的类,当然我们可以用现有的三种方法来实现“判断地址空间是否相同”。

  综上所述,我们可以总结出使用Set的三种不同的情形:(以下假设元素类为Element)

  A、如果想使用Element的equals方法来判断元素是否相同,那么可以使用CopyOnWriteArraySet来构造类的实体。

  B、如果Element实现了Comparable接口,而且想使用compareTo方法来判断元素是否相同,那么可以使用TreeSet来构造类的实体。

  C、如果想使用判断hashCode是否相同的方法来判断元素是否相同,那么可以使用HashSet来构造类的实体。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
1 目标检测的定义 目标检测(Object Detection)的任务是找出图像所有感兴趣的目标(物体),确定它们的类别和位置,是计算机视觉领域的核心问题之一。由于各类物体有不同的外观、形状和姿态,加上成像时光照、遮挡等因素的干扰,目标检测一直是计算机视觉领域最具有挑战性的问题。 目标检测任务可分为两个关键的子任务,目标定位和目标分类。首先检测图像目标的位置(目标定位),然后给出每个目标的具体类别(目标分类)。输出结果是一个边界框(称为Bounding-box,一般形式为(x1,y1,x2,y2),表示框的左上角坐标和右下角坐标),一个置信度分数(Confidence Score),表示边界框是否包含检测对象的概率和各个类别的概率(首先得到类别概率,经过Softmax可得到类别标签)。 1.1 Two stage方法 目前主流的基于深度学习的目标检测算法主要分为两类:Two stage和One stage。Two stage方法将目标检测过程分为两个阶段。第一个阶段是 Region Proposal 生成阶段,主要用于生成潜在的目标候选框(Bounding-box proposals)。这个阶段通常使用卷积神经网络(CNN)从输入图像提取特征,然后通过一些技巧(如选择性搜索)来生成候选框。第二个阶段是分类和位置精修阶段,将第一个阶段生成的候选框输入到另一个 CNN 进行分类,并根据分类结果对候选框的位置进行微调。Two stage 方法的优点是准确度较高,缺点是速度相对较慢。 常见Tow stage目标检测算法有:R-CNN系列、SPPNet等。 1.2 One stage方法 One stage方法直接利用模型提取特征值,并利用这些特征值进行目标的分类和定位,不需要生成Region Proposal。这种方法的优点是速度快,因为省略了Region Proposal生成的过程。One stage方法的缺点是准确度相对较低,因为它没有对潜在的目标进行预先筛选。 常见的One stage目标检测算法有:YOLO系列、SSD系列和RetinaNet等。 2 常见名词解释 2.1 NMS(Non-Maximum Suppression) 目标检测模型一般会给出目标的多个预测边界框,对成百上千的预测边界框都进行调整肯定是不可行的,需要对这些结果先进行一个大体的挑选。NMS称为非极大值抑制,作用是从众多预测边界框挑选出最具代表性的结果,这样可以加快算法效率,其主要流程如下: 设定一个置信度分数阈值,将置信度分数小于阈值的直接过滤掉 将剩下框的置信度分数从大到小排序,选值最大的框 遍历其余的框,如果和当前框的重叠面积(IOU)大于设定的阈值(一般为0.7),就将框删除(超过设定阈值,认为两个框的里面的物体属于同一个类别) 从未处理的框继续选一个置信度分数最大的,重复上述过程,直至所有框处理完毕 2.2 IoU(Intersection over Union) 定义了两个边界框的重叠度,当预测边界框和真实边界框差异很小时,或重叠度很大时,表示模型产生的预测边界框很准确。边界框A、B的IOU计算公式为: 2.3 mAP(mean Average Precision) mAP即均值平均精度,是评估目标检测模型效果的最重要指标,这个值介于0到1之间,且越大越好。mAP是AP(Average Precision)的平均值,那么首先需要了解AP的概念。想要了解AP的概念,还要首先了解目标检测Precision和Recall的概念。 首先我们设置置信度阈值(Confidence Threshold)和IoU阈值(一般设置为0.5,也会衡量0.75以及0.9的mAP值): 当一个预测边界框被认为是True Positive(TP)时,需要同时满足下面三个条件: Confidence Score > Confidence Threshold 预测类别匹配真实值(Ground truth)的类别 预测边界框的IoU大于设定的IoU阈值 不满足条件2或条件3,则认为是False Positive(FP)。当对应同一个真值有多个预测结果时,只有最高置信度分数的预测结果被认为是True Positive,其余被认为是False Positive。 Precision和Recall的概念如下图所示: Precision表示TP与预测边界框数量的比值 Recall表示TP与真实边界框数量的比值 改变不同的置信度阈值,可以获得多组Precision和Recall,Recall放X轴,Precision放Y轴,可以画出一个Precision-Recall曲线,简称P-R
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值