Java集合——第一部分

上一篇:枚举类与注解


11. Java集合

11.1 Java集合框架概述
1. 相关概述

引入集合的原因

一方面,面向对象语言对事物的体现都是以对象的形式,为了方便对多个对象的操作,就要对对象进行存储。另一方面,使用Array存储对象方面具有一些弊端,而Java 集合就像一种容器,可以动态地把多个对象的引用放入容器中。

集合、数组都是对多个数据进行存储操作的结构,简称Java容器。(此时的存储,主要指的是内存层面的存储,不涉及到持久化的存储)

数组在内存存储方面的特点:

  • 数组初始化以后,长度就确定了
  • 数组声明的类型,就决定了进行元素初始化时的类型

数组在存储数据方面的弊端:

  • 数组初始化以后,长度就不可变了,不便于扩展
  • 数组中提供的属性和方法少,不便于进行添加、删除、插入等操作,且效率不高。同时无法直接获取存储元素的个数
  • 数组存储的数据是有序的、可以重复的,存储数据的特点单一

Java 集合类可以用于存储数量不等的多个对象,还可用于保存具有映射关系的关联数组。

2. Java集合体系

Java 集合可分为 Collection 和 Map 两种体系

Collection接口:单列数据,定义了存取一组对象的方法的集合

  • List:元素有序、可重复的集合

    • ArrayList、LinkedList、Vector…
  • Set:元素无序、不可重复的集合

    • HashSet、LinkedHashSet、TreeSet…

Map接口:双列数据,保存具有映射关系“key-value对”的集合

  • HashMap、LinkedHashMap、TreeMap、Hashtable、Properties…
11.2 Collection接口方法
1. Collection接口介绍
  • Collection 接口是 List、Set 和 Queue 接口的父接口,该接口里定义的方法既可用于操作 Set 集合,也可用于操作 List 和 Queue 集合。
  • JDK不提供此接口的任何直接实现,而是提供更具体的子接口(如:Set和List)实现。
  • 在 Java5 之前,Java 集合会丢失容器中所有对象的数据类型,把所有对象都当成 Object 类型处理;从 JDK 5.0 增加了泛型以后,Java 集合可以记住容器中对象的数据类型。
  • 向Collection接口的实现类的对象中添加数据时,要求数据所在类要重写equals()。
2. Collection接口中的方法
  1. 添加

    • boolean add(E e):将元素e添加到当前的集合中(E为泛型,可以看作是Object,下同)
    • boolean addAll(Collection<? extends E> c):将c集合中的元素添加到当前的集合中
  2. 获取有效元素的个数

    • int size():获取添加的元素的个数
  3. 清空集合

    • void clear():清空集合元素
  4. 是否是空集合

    • boolean isEmpty():判断当前集合是否为空
  5. 是否包含某个元素

    • boolean contains(Object o):判断当前集合中是否包含o;在判断时会调用o对象所在类的equals(),即是通过元素的equals方法来判断是否是同一个对象
    • boolean containsAll(Collection<?> c):判断形参c中的所有元素是否都存在于当前集合中,也是调用元素的equals方法来拿两个集合的元素挨个比较
  6. 删除

    • boolean remove(Object o):从当前集合中移除o元素,通过元素的equals方法判断要删除的那个元素是否在集合中,只会删除找到的第一个元素
    • boolean removeAll(Collection<?> c):从当前集合中移除c中所有的元素,即取差集
  7. 取两个集合的交集

    • boolean retainAll(Collection<?> c):获取当前集合和c集合的交集,并把交集的结果存在当前集合中,不影响c
  8. 集合是否相等

    • boolean equals(Object o):判断当前集合的所有元素是否与形参集合的所有元素相同(不同实现类的比较方式可能不同,例如ArrayList集合的存储顺序也要一样,两个集合才相等)
  9. 转成对象数组

    • Object[] toArray():将集合转为Object类型的数组

    • <T> T[] toArray(T[] a):将集合转为T类型的数组,并存放到a中,且还会将生成的数组返回

      public class CollectionTest {
          public static void main(String[] args) {
              List<String> list = Arrays.asList("123", "456");
              String[] str1 = new String[list.size()];
              String[] str2 = list.toArray(str1);
              System.out.println(Arrays.toString(str1)); // 输出[123, 456]
              System.out.println(Arrays.toString(str2)); // 输出[123, 456]
          }
      }
      

    补充:数组转集合:调用Arrays的asList方法

    <T> List<T> asList(T… a):将可变形参a转为List集合(如果是基本数据类型的数组,则会认为是一个元素)

    public class CollectionTest {
        public static void main(String[] args) {
            List<String> list1 = Arrays.asList("123", "456");
            System.out.println(list1); // [123, 456]
            List<String> list2 = Arrays.asList(new String[]{"123", "456"});
            System.out.println(list2); // [123, 456]
    
            List<Integer> list3 = Arrays.asList(123, 456);
            System.out.println(list3.size()); // 2
            System.out.println(list3); // [123, 456]
            
            // ----------注意----------
            List<int[]> list4 = Arrays.asList(new int[]{123, 456});
            System.out.println(list4.size()); // 1
            System.out.println(list4); // [[I@1b6d3586]
            
            List<Integer> list5 = Arrays.asList(new Integer[]{123, 456});
            System.out.println(list5.size()); // 2
            System.out.println(list5); // [123, 456]
        }
    }
    
  10. 获取集合对象的哈希值

    • int hashCode():返回当前集合对象的哈希值
  11. 遍历

    • Iterator<E> iterator():返回Iterator接口的实例,用于遍历集合元素
11.3 Iterator迭代器接口
1. 相关说明
  • Iterator对象称为迭代器(设计模式的一种),主要用于遍历 Collection 集合中的元素。
  • GOF给迭代器模式的定义为:提供一种方法访问一个容器(container)对象中各个元素,而又不需暴露该对象的内部细节。迭代器模式,就是为容器而生。
  • Collection接口继承了java.lang.Iterable接口,该接口有一个iterator()方法,那么所有实现了Collection接口的集合类都有一个iterator()方法,用以返回一个实现了Iterator接口的对象。
  • Iterator 仅用于遍历集合,Iterator 本身并不提供承装对象的能力。如果需要创建 Iterator 对象,则必须有一个被迭代的集合。
  • 集合对象每次调用iterator()方法都得到一个全新的迭代器对象,默认游标都在集合的第一个元素之前。
2. Iterator接口的方法
  • boolean hasNext():判断集合中是否还存在下一个元素

  • E next():①将指针下移 ②将下移以后集合位置上的元素返回

    在调用it.next()方法之前必须要调用it.hasNext()进行检测。若不调用,且下一条记录无效,直接调用it.next()会抛出NoSuchElementException异常

  • void remove():移除集合中的当前元素(JDK1.8变成了默认方法)

    • Iterator可以删除集合的元素,但是是遍历过程中通过迭代器对象的remove方法,不是集合对象的remove方法
    • 如果还未调用next()或在上一次调用 next 方法之后已经调用了 remove 方法, 再调用remove都会报IllegalStateException
3. 迭代器的原理

例子

public class IteratorTest {
    public static void main(String[] args) {
        Collection coll = Arrays.asList("123", "456");
        // 获取迭代器对象
        Iterator iterator = coll.iterator();
        // 判断是否存在下一个元素
        while (iterator.hasNext()) {
            // 指针下移并将元素返回
            Object next = iterator.next();
            System.out.println(next);
        }
    }
}

原理

首先根据集合对象获取迭代器实例,获取的迭代器实例的默认游标在集合的第一个元素之前,然后通过hasNext()方法判断是否存在下一个元素,如果存在则通过next()方法先将游标向下移,然后返回当前指向的元素。

4. foreach——增强for循环

说明

  • Java 5.0 提供了 foreach 循环迭代访问 Collection和数组。
  • 遍历操作不需获取Collection或数组的长度,无需使用索引访问元素。
  • 遍历集合的底层调用Iterator完成操作。
  • foreach还可以用来遍历数组。

格式

for (要遍历的元素类型 遍历后自定义元素名称 : 要遍历的结构名称) {
    // 执行逻辑
}

例子

public class ForEachTest {
    public static void main(String[] args) {
        Collection coll = Arrays.asList("123", 456);
        for (Object o : coll) {
            System.out.println(o);
        }
    }
}

执行流程

首先coll取出一个元素赋值给o,然后输出o的内容,之后如果coll中还有元素,则再次取出赋值给o,直到coll中没有元素

5. 默认方法——foreach

JDK 1.8时Iterable接口提供了一个默认方法forEach,Collection接口继承了Iterable接口,因此其也具有该方法,能够直接遍历Collection集合

方法声明

default void forEach(Consumer<? super T> action)

例子

public class ForEachTest {
    public static void main(String[] args) {
        Collection coll = Arrays.asList(123, 456, "aaa");
        coll.forEach(System.out::println); // jdk8新特性lambda表达式 
    }
}
11.4 Collection子接口之一: List接口
1. List接口概述
  • 鉴于Java中数组用来存储数据的局限性,通常使用List替代数组(可以将List理解为动态数组,能够根据变换长度)
  • List集合类中元素有序、且可重复,集合中的每个元素都有其对应的顺序索引
  • List容器中的元素都对应一个整数型的序号记载其在容器中的位置,可以根据序号存取容器中的元素
  • JDK API中List接口的实现类常用的有:ArrayList、LinkedList和Vector
  • 向List中添加的数据,其所在的类一定要重写和equals(),以实现对象相等规则(remove() / contains()等方法需要)
2. List接口方法

List除了从Collection集合继承的方法外,List 集合里添加了一些根据索引来操作集合元素的方法。

方法说明
void add(int index, E element)在index位置插入element元素
boolean addAll(int index, Collection<? extends E> c)从index位置开始将c中的所有元素添加进来
E get(int index);获取指定index位置的元素
int indexOf(Object o)返回o在集合中首次出现的位置,如果不存在,返回-1
int lastIndexOf(Object o)返回o在当前集合中末次出现的位置,如果不存在,返回-1
E remove(int index)移除指定index位置的元素,并返回此元素
E set(int index, E element)设置指定index位置的元素为element
List<E> subList(int fromIndex, int toIndex)返回从fromIndex到toIndex位置的左闭右开区间的子集合
3. List实现类之一:ArrayList

相关说明

  • ArrayList 是 List 接口的典型实现类、主要实现类
  • 本质上,ArrayList是对象引用的一个”变长”数组
  • ArrayList的JDK1.8之前与之后的实现有所区别
    • jdk7中的ArrayList的对象的创建类似于单例的饿汉式,直接创建一个初始容量为10的数组
    • jdk8中的ArrayList的对象的创建类似于单例的懒汉式,一开始创建一个长度为0的数组,当添加第一个元 素时再创建一个始容量为10的数组,延迟了数组的创建,节省内存
  • Arrays.asList(…) 方法返回的 List 集合,既不是 ArrayList 实例,也不是 Vector 实例。Arrays.asList(…) 返回值是一个固定长度的 List 集合
  • 在创建ArrayList对象时,最好使用带参构造器进行创建
  • ArrayList是线程不安全的,效率高
  • ArrayList底层使用Object[] elementData存储
  • ArrayList可以存储null值

源码分析

jdk 7情况下

源码:

private transient Object[] elementData;
// 空参构造器
public ArrayList() {
    this(10); // 调用自身的带参构造器
}
// 带参构造器
public ArrayList(int initialCapacity) {
    super();
    if (initialCapacity < 0) // 判断初始容量是否合法
        throw new IllegalArgumentException("Illegal Capacity: "+
                                           initialCapacity);
    // 如果合法则创建一个长度为10的数组
    this.elementData = new Object[initialCapacity]; 
}
// 添加元素
public boolean add(E e) {
    ensureCapacityInternal(size + 1);  // 在添加元素前先判断数组的长度是否足够
    elementData[size++] = e; // 进行元素添加
    return true;
}
// 判断容量是足够,如果不够则扩容
private void ensureCapacityInternal(int minCapacity) {
    modCount++;
    // 判断当前的元素需要的最小长度是否已经超过了创建的数组的长度
    if (minCapacity - elementData.length > 0)
        grow(minCapacity); // 如果超过了就进行扩容
}
// 扩容
private void grow(int minCapacity) {
    // 获取当前创建的数组的长度
    int oldCapacity = elementData.length;
    // 将长度扩容为原理的1.5倍
    int newCapacity = oldCapacity + (oldCapacity >> 1);
    // 如果扩容后的长度还不够则直接将目前所需的长度作为扩容的长度
    if (newCapacity - minCapacity < 0)
        newCapacity = minCapacity;
    // 如果目前容量超过设定值,则调用其他方法获取长度(实际直接拿最大的整型数作为容量)
    if (newCapacity - MAX_ARRAY_SIZE > 0)
        newCapacity = hugeCapacity(minCapacity);
    // 复制元素到新数组,并赋值给当前数组
    elementData = Arrays.copyOf(elementData, newCapacity);
}

分析:

首先使用空参构造器创建一个ArrayList对象,则其底层会创建一个长度为10的Object[]数组elementData,而后调用add()方法,则会先判断容量是否足够,如果不够,则进行扩容,默认情况下,扩容为原来的容量的1.5倍,同时需要将原有数组中的数据复制到新的数组中。

ArrayList list = new ArrayList(); // 底层创建了长度是10的Object[]数组elementData
list.add(123); // elementData[0] = new Integer(123);
...
list.add(11); // 如果此次的添加导致底层elementData数组容量不够,则扩容。

jdk 8情况下

源码:

private static final int DEFAULT_CAPACITY = 10;
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
private transient Object[] elementData;
// 空参构造器
public ArrayList() {
    this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}
// 添加元素
public boolean add(E e) {
    ensureCapacityInternal(size + 1);  // 在添加元素前先判断数组的长度是否足够
    elementData[size++] = e; // 进行元素添加
    return true;
}
// 判断容量是足够,如果不够则扩容(会先计算容量)
private void ensureCapacityInternal(int minCapacity) {
    ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
}
// 计算容量
private static int calculateCapacity(Object[] elementData, int minCapacity) {
    // 判断当前数组是否为初始化时的数组
    if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
        return Math.max(DEFAULT_CAPACITY, minCapacity); // 返回默认容量(10)和当前当前所需的容量的最大值
    }
    return minCapacity;
}
// 判断容量是足够,如果不够则扩容
private void ensureExplicitCapacity(int minCapacity) {
    modCount++;
    // 判断当前的元素需要的最小长度是否已经超过了创建的数组的长度
    if (minCapacity - elementData.length > 0)
        grow(minCapacity); // 如果超过了就进行扩容
}
// 扩容
private void grow(int minCapacity) {
    // 获取当前创建的数组的长度
    int oldCapacity = elementData.length;
    // 将长度扩容为原理的1.5倍
    int newCapacity = oldCapacity + (oldCapacity >> 1);
    // 如果扩容后的长度还不够则直接将目前所需的长度作为扩容的长度
    if (newCapacity - minCapacity < 0)
        newCapacity = minCapacity;
    // 如果目前容量超过设定值,则调用其他方法获取长度(实际直接拿最大的整型数作为容量)
    if (newCapacity - MAX_ARRAY_SIZE > 0)
        newCapacity = hugeCapacity(minCapacity);
    // 复制元素到新数组,并赋值给当前数组
    elementData = Arrays.copyOf(elementData, newCapacity);
}

分析:

首先使用空参构造器创建一个ArrayList对象,则其底层会创建一个空的Object[]数组elementData,而后在第一次调用add()方法,则会先创建一个长度为10的数组,之后的扩容机制则和jdk7中相同

ArrayList list = new ArrayList(); // 底层Object[] elementData初始化为{}.并没有创建长度为10的数组
list.add(123); // 第一次调用add()时,底层才创建了长度10的数组,并将数据123添加到elementData[0]
...
// 后续的添加和扩容操作与jdk7相同
4. List实现类之二:LinkedList

相关说明

  • 对于频繁的插入、删除操作,使用LinkedList效率比ArrayList高
  • LinkedList底层使用双向链表存储
  • LinkedList可以存储null值

新增方法

方法说明
void addFirst(E e)在此集合的开头插入指定的元素
void addLast(E e)将指定的元素追加到此集合的末尾,此方法相当于add()
E getFirst()返回此集合中的第一个元素
E getLast()返回此集合中的最后一个元素
E removeFirst从此集合中删除并返回第一个元素
E removeLast()从此集合中删除并返回最后一个元素

源码分析

源码:

// 头节点
transient Node<E> first;
// 尾节点
transient Node<E> last;
// Node内部类
private static class Node<E> {
    E item; // 当前元素
    Node<E> next; // 下一个节点
    Node<E> prev; // 上一个节点
	// 有参构造方法
    Node(Node<E> prev, E element, Node<E> next) {
        this.item = element;
        this.next = next;
        this.prev = prev;
    }
}
// 添加元素方法
public boolean add(E e) {
    linkLast(e); // 调用添加最后一个元素方法
    return true;
}
// 向最后添加一个元素
void linkLast(E e) {
    final Node<E> l = last; // 获取当前的最后一个元素
    final Node<E> newNode = new Node<>(l, e, null); // 创建新节点
    last = newNode; // 将新添加的节点作为尾节点
    if (l == null) // 判断是否存在尾节点(即判断是否是第一个元素的添加)
        first = newNode; // 将新节点作为头节点
    else
        l.next = newNode; // 让添加前的尾节点指向新节点
    size++;
    modCount++;
}

分析:

LinkedList:双向链表,内部没有声明数组,而是定义了Node类型的first和last,用于记录首末元素。同时,定义内部类Node,作为LinkedList中保存数据的基本结构。Node除了保存数据,还定义了两个变量:

  • prev变量记录前一个元素的位置
  • next变量记录下一个元素的位置

首先创建一个LinkedList对象,之后添加元素,如果为第一次添加,则将该添加的元素作为头节点,也作为尾节点,如果不是第一次添加,则将当前添加的元素作为尾节点,并让之前的尾节点指向当前新添加的节点

LinkedList list = new LinkedList(); // 内部声明了Node类型的first和last属性,默认值为null
list.add(123); // 将123封装到Node中,创建了Node对象。
5. List 实现类之三:Vector

相关说明

  • Vector是一个古老的集合,JDK1.0就有了
  • Vector底层使用Object[] elementData存储
  • Vector大多数操作与ArrayList 相同
  • Vector是线程安全的,效率低
  • Vector可以存储null值
  • 在各种list中,最好把ArrayList作为缺省选择。当插入、删除频繁时,使用LinkedList;Vector总是比ArrayList慢,所以尽量避免使用

新增方法

方法说明
void addElement(E obj)将指定对象添加到此集合末尾
void insertElementAt(E obj, int index)将指定对象插入此集合中的指定索引处
void setElementAt(E obj, int index)将此集合指定索引处的对象设置为指定对象
boolean removeElement(Object obj)将指定元素从该集合中删除
void removeAllElements()从该集合中删除所有元素并将大小设置为零,此方法相当于clear()

源码分析

protected int capacityIncrement;
private void grow(int minCapacity) {
    // overflow-conscious code
    int oldCapacity = elementData.length;
    int newCapacity = oldCapacity + ((capacityIncrement > 0) ?
                                     capacityIncrement : oldCapacity);
    if (newCapacity - minCapacity < 0)
        newCapacity = minCapacity;
    if (newCapacity - MAX_ARRAY_SIZE > 0)
        newCapacity = hugeCapacity(minCapacity);
    elementData = Arrays.copyOf(elementData, newCapacity);
}

jdk7和jdk8中通过Vector()构造器创建对象时,底层都创建了长度为10的数组。在扩容方面,基本与ArrayList相同,默认扩容为原来的数组长度的2倍。

6. ArrayList、LinkedList、Vector三者的异同

相同:三个类都是实现了List接口,存储数据的特点相同:存储有序的、可重复的数据

不同:

  • ArrayList:作为List接口的主要实现类;是线程不安全的,效率高;底层使用Object[] elementData存储
  • LinkedList:对于频繁的插入、删除操作,使用此类效率比ArrayList高;底层使用双向链表存储
  • Vector:作为List接口的古老实现类;线程安全的,效率低;底层使用Object[] elementData存储
其他说明

ArrayList和LinkedList的异同

二者都线程不安全,相对线程安全的Vector,执行效率高。此外,ArrayList是实现了基于动态数组的数据结构,而LinkedList是基于链表的数据结构。对于随机访问get和set,ArrayList优于LinkedList,因为LinkedList要移动指针。对于新增和删除操作add(特指插入)和remove,LinkedList比较占优势,因为ArrayList要移动数据。

ArrayList和Vector的区别

Vector和ArrayList几乎是完全相同的,唯一的区别在于Vector是同步类(synchronized),属于强同步类。因此开销就比ArrayList要大,访问要慢。正常情况下,大多数的Java程序员使用ArrayList而不是Vector,因为同步完全可以由程序员自己来控制。**Vector每次扩容请求其大小的2倍空间,而ArrayList是1.5倍。**Vector还有一个子类Stack。

7. List集合总结

常用方法
增:add(Object obj)
删:remove(int index) / remove(Object obj)
改:set(int index, Object ele)
查:get(int index)
插:add(int index, Object ele)
长度:size()
遍历:Iterator迭代器方式 / 增强for循环 / 普通的循环

11.5 Collection子接口之二: Set接口
1. Set 接口概述
  • Set接口是Collection的子接口,set接口没有提供额外的方法

  • Set集合中存储的是无序的、不可重复的数据

    说明:以HashSet为例

    • 无序性:不等于随机性。存储的数据在底层数组中并非按照数组索引的顺序添加,而是根据数据的哈希值决定的
    • 不可重复性:保证添加的元素按照equals()判断时,不能返回true;即:相同的元素只能添加一个
  • Set 集合不允许包含相同的元素,如果试把两个相同的元素加入同一个 Set 集合中,则添加操作失败

  • Set 判断两个对象是否相同不是使用 == 运算符,而是根据 equals() 方法

  • JDK API中Set接口的实现类常用的有:HashSet、LinkedHashSet和TreeSet

  • 向Set(主要指:HashSet、LinkedHashSet)中添加的数据,其所在的类一定要重写hashCode()和equals(),以实现对象相等规则(HashSet和LinkedHashSet需要调用这两个方法进行数据的存储,使用TreeSet时不会调用这两个方法,而是使用的排序接口)

  • 重写的hashCode()和equals()尽可能保持一致性:相等的对象必须具有相等的散列码

    重写技巧:对象中用作 equals() 方法比较的 Field,都应该用来计算 hashCode 值

2. Set实现类之一:HashSet

相关说明

  • HashSet 是 Set 接口的典型实现,大多数时候使用 Set 集合时都使用这个实现类。

  • HashSet 按 Hash 算法来存储集合中的元素,因此具有很好的存取、查找、删除性能。

  • HashSet 的特点

    • 不能保证元素的排列顺序
    • HashSet 不是线程安全的
    • 集合元素可以是 null
  • HashSet 集合判断两个元素相等的标准:两个对象通过 hashCode() 方法比较相等,并且两个对象的 equals() 方法返回值也相等。

  • HashSet底层:

    • jdk 7:数组+链表的结构;在创建对象时,会直接初始化一个长度为16的数组

    • jdk 8:数组+链表+红黑树;在创建对象时,和ArrayList类似,会初始化一个空数组

    • 当如果数组的使用率超过0.75,就会扩大容量为原来的2倍

3. Set集合添加元素的过程:以HashSet为例
  1. 当向 HashSet 集合中存入一个元素时,HashSet 会调用该对象的 hashCode() 方法来得到该对象的 hash 值,然后根据 hash 值,通过某种散列函数决定该对象在 HashSet 底层数组中的存储位置(即为索引位置)。(这个散列函数会与底层数组的长度相计算得到在数组中的下标,并且这种散列函数计算还尽可能保证能均匀存储元素,越是散列分布,该散列函数设计的越好)
  2. 判断数组此位置上是否已经有元素,如果此位置上没有其他元素,则元素添加成功(直接添加在数组中);如果此位置上有其他元素(或以链表形式存在的多个元素),则比较添加的元素与该位置上的所有元素的hash值
  3. 如果hash值都不相等,则元素添加成功(通过链表的方式继续链接);如果有hash值相等的元素,则会再继续调用equals方法,如果equals方法结果为false,则元素添加成功(通过链表的方式继续链接);如果为true,则元素添加失败

对于后面两种添加成功的情况而言:新添加的元素与已经存在指定索引位置上数据以链表的方式存储。

  • jdk 7:新添加的元素放到数组中,指向原来的元素
  • jdk 8:原来的元素在数组中,指向新添加的元素
4. 重写 hashCode() 方法和 equals() 方法的基本原则

hashCode()

  • 在程序运行时,同一个对象多次调用 hashCode() 方法应该返回相同的值。
  • 当两个对象的 equals() 方法比较返回 true 时,这两个对象的 hashCode() 方法的返回值也应相等。
  • 对象中用作 equals() 方法比较的 Field,都应该用来计算 hashCode 值。

equals()

  • 当一个类有自己特有的“逻辑相等”概念,当改写equals()的时候,总是要改写hashCode()。根据一个类的equals方法(改写后),两个截然不同的实例有可能在逻辑上是相等的,但是,根据Object.hashCode()方法,它们仅仅是两个对象。此时,违反了 “相等的对象必须具有相等的散列码” ,那么就需要重写equals()和hashCode()。
  • 重写equals方法的时候一般都需要同时重写hashCode方法。通常参与计算hashCode的对象的属性也应该参与到equals()中进行计算。

例子

public class Person {
    String name;
    int age;

    @Override
    public boolean equals(Object o) {
        if (this == o) return true;
        if (o == null || getClass() != o.getClass()) return false;

        Person person = (Person) o;

        if (age != person.age) return false;
        return name != null ? name.equals(person.name) : person.name == null;
    }

    @Override
    public int hashCode() {
        int result = name != null ? name.hashCode() : 0;
        result = 31 * result + age;
        return result;
    }
}
5. Set实现类之二:LinkedHashSet

相关说明

  • LinkedHashSet 是 HashSet 的子类
  • LinkedHashSet 根据元素的 hashCode 值来决定元素的存储位置,但它同时使用双向链表维护元素的次序,这使得元素看起来是以插入顺序保存的
  • LinkedHashSet插入性能略低于 HashSet,但在迭代访问 Set 里的全部元素时有很好的性能
  • LinkedHashSet 不允许集合元素重复
  • 遍历其内部数据时,可以按照添加的顺序遍历(不代表就不是无序的)
  • 对于频繁的遍历操作,LinkedHashSet效率高于HashSet
  • 集合元素可以是 null

LinkedHashSet底层结构

LinkedHashSet底层结构

6. Set实现类之三:TreeSet

相关说明

  • TreeSet是 SortedSet 接口的实现类,TreeSet 可以确保集合元素处于排序状态。
  • TreeSet底层使用红黑树结构存储数据
  • TreeSet可以按照添加对象的指定属性,进行排序
  • TreeSet两种排序方法:自然排序(添加元素的类实现Comparable接口)和定制排序(使用TreeSet的带参构造方法,传入Comparator接口的实现类)。默认情况下,TreeSet 采用自然排序
  • 向TreeSet中添加的数据,要求是相同类的对象
  • TreeSet比较两个对象是否相等不再是调用equals()方法,而是根据排序
    • 自然排序中,比较两个对象是否相同的标准为:compareTo()返回0
    • 定制排序中,比较两个对象是否相同的标准为:compare()返回0

新增方法

方法说明
Comparator<? super E> comparator()返回对此集合中的元素进行排序的比较器;如果此集合使用其元素的自然顺序,则返回 null
E first()返回此集合中当前第一个(最小)元素
E last()返回此集合中当前最后一个(最大)元素
E lower(E e)返回此集合中严格小于给定元素的最大元素;如果不存在这样的元素,则返回 null
E higher(E e)返回此集合中严格大于给定元素的最小元素;如果不存在这样的元素,则返回 null
SortedSet<E> subSet(E fromElement, E toElement)返回此集合的部分视图,其元素从fromElement(包括)到 toElement(不包括)
SortedSet<E> headSet(E toElement)返回此集合的部分视图,其元素严格小于 toElement
SortedSet<E> tailSet(E fromElement))返回此集合的部分视图,其元素大于等于 fromElement

TreeSet底层结构

TreeSet底层采用红黑树的存储结构;TreeSet的特点是:有序,查询速度比List快

TreeSet底层结构

7. TreeSet中涉及的排序相关问题

自然排序

  • 自然排序:TreeSet 会调用集合元素的 compareTo(Object obj) 方法来比较元素之间的大小关系,然后将集合元素按升序(默认情况)排列

  • 如果试图把一个对象添加到 TreeSet 时,则该对象的类必须实现 Comparable 接口

    实现 Comparable 的类必须实现 compareTo(Object obj) 方法,两个对象即通过 compareTo(Object obj) 方法的返回值来比较大小

  • Comparable 的典型实现:

    • BigDecimal、BigInteger 以及所有的数值型对应的包装类:按它们对应的数值大小进行比较
    • Character:按字符的unicode值来进行比较
    • Boolean:true 对应的包装类实例大于 false 对应的包装类实例
    • String:按字符串中字符的 unicode 值进行比较
    • Date、Time:后边的时间、日期比前面的时间、日期大
  • 向 TreeSet 中添加元素时,只有第一个元素无须比较compareTo()方法,后面添加的所有元素都会调用compareTo()方法进行比较

  • 因为只有相同类的两个实例才会比较大小,所以向 TreeSet 中添加的应该是同一个类的对象

  • 对于 TreeSet 集合而言,它判断两个对象是否相等的唯一标准是:两个对象通过 compareTo(Object obj) 方法比较返回值

  • 当需要把一个对象放入 TreeSet 中,重写该对象对应的 equals() 方法时,应保证该方法与 compareTo(Object obj) 方法有一致的结果:如果两个对象通过 equals() 方法比较返回 true,则通过 compareTo(Object obj) 方法比较应返回 0

定制排序

  • TreeSet的自然排序要求元素所属的类实现Comparable接口,如果元素所属的类没有实现Comparable接口,或不希望按照升序(默认情况)的方式排列元素或希望按照其它属性大小进行排序,则考虑使用定制排序。定制排序,通过Comparator接口来实现。需要重写compare(T o1,T o2)方法
  • 利用int compare(T o1,T o2)方法,比较o1和o2的大小:如果方法返回正整数,则表示o1大于o2;如果返回0,表示相等;返回负整数,表示o1小于o2
  • 要实现定制排序,需要将实现Comparator接口的实例作为形参传递给TreeSet的构造器
  • 此时,仍然只能向TreeSet中添加类型相同的对象。否则发生ClassCastException异常
  • 使用定制排序判断两个元素相等的标准是:通过Comparator比较两个元素返回了0

下一篇:Java集合——第二部分

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

IT程

你的鼓励是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值