Java高级编程知识—8.1、Collection接口（List、Set）

go2studyy

已于 2022-01-23 00:17:21 修改

阅读量418

点赞数

分类专栏： Java学习文章标签： java list 开发语言

于 2022-01-11 23:46:01 首次发布

本文链接：https://blog.csdn.net/shmily0822/article/details/122444246

版权

Java学习专栏收录该内容

15 篇文章 0 订阅

订阅专栏

文章目录

8、集合

概述

面向对象语言对事物的体现都是以对象的形式，为了方便地操作多个对象，就要存储对象。而用数组存储对象具有一些弊端，因此使用集合存储对象，集合就像一种容器，可以动态地把多个对象的引用放入容器中

数组在存储数据方面的特点：
- 一旦数组初始化后，其长度就确定了
- 数组一旦定义好，其元素类型就确定了，也就只能操作指定类型的数据了
数组在存储数据方面的弊端：
- 数组初始化后长度不可变，不便于扩展
- 数组中提供的属性和方法少，不便于进行添加、删除、插入等操作，且效率不高
- 数组无法直接获取存储元素的个数
- 数组存储的数据是有序的、可重复的——存储数据特点单一，不能满足无序、无重复的需求

Java集合类可以用于存储数量不等的多个对象，还可用于保存具有映射关系的关联数组

8.1、Collection接口

Collection接口：单列集合，用来存储多个对象

List接口：存储有序的、可重复的数据 ——“动态数组”
- 实现类：ArrayList、LinkedList、Vector
Set接口：存储无序的、不可重复的数据 ——数学中的”集合“
- 实现类HashSet、LinkedHashSet、TreeSet

Collection< E >常用方法：

add（E e）：将元素e添加到集合中
size（）：获取元素个数
addAll（Collection coll）：将集合coll中的元素添加到当前集合中
clear（）：清空集合元素
isEmpty（）：判断当前集合是否为空
contains（E e）：判断当前集合是否包含元素e
- 向Collection接口的实现类对象中添加数据e时，要求e所在类E要重写equals（），否则无法使用contains、remove以及去重功能
containsAll（Collection coll）：判断集合coll中的所有元素是否都存在于当前集合中
remove（E e）：从集合中移除元素e
removeAll（Collection coll）：从当前集合中移除coll中所有的共有元素
retainAll（Collection coll）：获取当前集合和coll集合的交集，并返回给当前集合
equals（Object o）：返回当前集合和形参集合是否相等
hashCode（）：返回当前对象的哈希值

toArray（）：集合——>数组

Arrays.asList（数组）：数组——>集合
使用asList将基本数据类型的数组转集合时，必须使用包装类，否则会把数组视为一个元素

List list = Arrays.asList(new int[]{123,456,789});
List list1 = Arrays.asList(new Integer[]{123,456,789});
System.out.println(list); //[[I@3d82c5f3]
System.out.println(list1); //[123, 456, 789]

iterator（）：返回Iterator接口的实例，用于遍历集合元素
- hasNext（）：判断是否还有下一个元素
- next（）：指针下移，将下移以后集合位置上的元素返回
- remove（）：移除当前指针位置的元素
  - 如果还未调用next（）或在上一次调用next（）已经调用remove（）时，再调用remove（），则会报IllegalStateException异常

Iterator对象称为迭代器（设计模式的一种），主要用于遍历Collection

Iterator iterator = coll.iterator();
//集合对象每次调用iterator（）方法都会得到一个全新的迭代器对象，默认游标都在集合第一个元素之前
while(iterator.hasNext()){
    System.out.println(iterator.next());
}

JDK5.0 新增增强for遍历集合、数组

for（集合元素类型 局部变量 : 集合对象）｛
	操作局部变量。。。	
    //内部仍然调用了迭代器
｝

结论：使用Collection接口的实现类集合存放数据对象时，数据对象所在类必须重写equals（）方法

1.1 List接口

List接口的方法

void add（int index，Object obj）：在index位置插入obj元素
boolean addAll（int index，Collection c）：从index位置开始插入集合c中所有元素
Object get（int index）：获取指定index位置的元素
int indexOf（Object obj）：返回obj在List中首次出现的位置
int lastIndexOf（Object obj）：返回obj在List中末次出现的位置
Object remove（int index）：移除指定index位置的元素并返回
Object set（int index，Object obj）：设置指定inex位置的元素为obj
List sublist（int fromIndex，int toIndex）：返回从fromIndex到toIndex位置的子List（左闭右开）

总结常用方法：

增：add（Object obj）

删：remove（int index）/ remove（Object obj）

改：set（int index，Object obj）

查：get（int index）、indexOf（Object obj）

插：add（int index，Object obj）

长度：size（）

遍历：Iterator迭代器、foreach、普通循环

1.2 List接口实现类

ArrayList：作为List接口的主要实现类；线程不安全，效率高；底层使用***Object[ ] elementData***存储
LinkedList：底层使用双向链表存储：对于频繁的插入、删除操作，使用此类比ArrayList效率高
Vector：作为List接口的古老实现类；线程安全，效率低；底层使用***Object[ ] elementData***存储

比较异同：

同：三个类都实现了List接口，存储数据的特点相同：存储有序的，可重复的数据

一、ArrayList源码分析

ArrayList list = new ArrayList();

JDK7及之前

底层创建了长度默认为10的Object[]数组elementData

如果list.add（element）导致底层数组容量不够，则扩容

默认情况下，底层数组扩容为原来容量的1.5倍，同时需要将原有数组中的数据复制到新数组

结论：开发中使用带参构造器：ArrayList list = new ArrayList（int capacity）
JDK8及之后

底层Object[]数组elementData初始化为空数组｛｝

第一次调用add（element）时，底层才创建了长度为10的数组，并将元素添加到数组中

后续的添加和扩容操作与JDK7相同
小结：JDK7中的ArrayList对象的初始化类似于单例模式的饿汉式；JDK8中的初始化类似于懒汉式，延迟了数组的创建，节省内存

二、LinkedList的源码分析

LinkedList list = new LinkedList();

LinkedList内部声明了Node类型的first和last属性，默认为null

list.add（element）：将element封装到Node中，创建了Node对象，其中Node定义为

private static class Node<E> {
    E item;
    Node<E> next;
    Node<E> prev;

    Node(Node<E> prev, E element, Node<E> next) {
        this.item = element;
        this.next = next;
        this.prev = prev;
    }
}

体现了LinkedList底层的双向链表

三、Vector的源码分析

jDK7和JDK8中通过Vector（）构造器创建对象时，底层都创建了长度为10的数组

在扩容方面，默认扩容为原来数组长度的2倍

1.3 Set接口

Set：存储无序的、不可重复的数据，

要求：向Set中添加的数据，其所在类一定要重写**hashCode（）和equals（）**方法

重写的hashCode（）和equals（）尽量保持一致性：相等的对象必须具有相等的散列码

底层是数组+链表的结构，数组默认初始化容量为16，当使用率超过0.75（负载因子），就会将容量扩大2倍

无序性：不等同于随机性。存储的数据在底层数组中并非按照数组索引的顺序添加，而是根据数据的哈希值决定的
不可重复性：保证添加的元素按照所属类的equals（）方法判断时，需要返回false，即：相同的元素只能添加一个
添加元素的过程：以HashSet为例
1. 向HashSet中添加元素a，首先调用元素a所在类的hashCode（）方法，计算元素a的哈希值
2. 根据此哈希值利用某种算法计算出在HashSet底层数组中的存放位置（即为索引位置），判断数组的此位置上是否已经有元素
  - 如果没有其他元素，则元素添加成功——情况1：放入数组
  - 如果有其他元素b（或以链表形式存放的多个元素），则比较元素a与b的hash值
    - 如果hash值不同，则元素a添加成功——情况2
    - 如果hash值相同，进而需要调用元素a所在类的equals（）方法：
      - equals（）返回true，元素a添加失败
      - equals（）返回false，则元素a添加成功——情况3
对于添加成功的情况2、3而言：元素a与已经存在指定索引位置上的数据以链表的方式存储

JDK 7：新元素a放到数组中，指向原来的元素（头插法）

JDK8：原来的元素在数组中，指向新元素a（尾插法）

问题：为什么hashCode（）方法常常用到31这个数字计算？

选择系数时要选择尽量大的，因为计算出来的hash地址越大，所谓的哈希冲突就越少，查找起来效率也会提高（减少冲突）
31是素数，如果用一个数组乘这个素数，那么最终出来的结果只能被素数本身、被乘数还有1来整除（减少冲突）
31只占用5bit，相乘造成数据溢出的概率较小（防止溢出）
31可以由i*31=（i<<5）-1来表示，（提高算法效率）

1.4 Set接口实现类

HashSet：Set接口的主要实现类；线程不安全的；可以存储null值
LinkedHashSet：HashSet的子类；遍历其内部数据时，可以按照添加的顺序遍历
- 在添加数据的同时，每个数据还维护了两个引用，记录次数据前一个和后一个数据
- 优点：对于频繁的遍历操作，LinkedHashSet效率高于HashSet
TreeSet：可以按照添加对象的指定属性，进行排序，底层是红黑树
1. TreeSet中只能添加相同类的对象
2. 两种排序方式：自然排序（实现Comparable接口）和定制排序（Comparator）
3. 自然排序中，比较两个对象是否相同的标准为：compareTo（）返回0，而不再是equals（）
4. 定制排序中，比较两个对象是否相同的标准为：compare（）返回0，而不再是equals（）

1.5 总结

集合Collection中存储自定义对象时，需要自定义类重写哪个方法？

List：equals（）
Set（HashSet、LinkedHashSet为例）：equals（）、hashCode（）
- TreeSet：Comparable：compareTo（o1）
  
  Comparator：compare（o1, o2）

我的学习笔记有更多精彩内容哦
Java编程知识专栏

go2studyy

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Java高级编程知识—8.1、Collection接口（List、Set）

Collection；List：Vector、ArrayList、LinkedList；Set：HashSet、LinkedHashSet、TreeSet；
复制链接

扫一扫