java集合包含ArrayList、Vector源码分析（随堂笔记）

即事随缘

于 2020-10-24 20:28:07 发布

阅读量126

点赞数

文章标签： 1024程序员节

本文链接：https://blog.csdn.net/qq_48692860/article/details/109265303

版权

一、集合框架的概述

集合、数组都是对多个数组进行存储的结构，简称Java容器；

说明：此时的存储，主要指的是内存层面的存储，不涉及到持久化的存储；

数组在存储多个数据方面的特点:

一旦初始化以后，其长度就确定了；
数组一旦定义好，其元素的类型也就确定了，我们也就只能操作指定类型的数据了；

数组在存储多个数据方面的缺点：

一旦初始化以后，其长度就不可修改；
数组中提供的方法非常有限，对于添加、删除、插入数据等操作，非常不便，同时效率不高；
获取数组中实际元素的个数的需求，数组没有现成的属性或方法可用；
数组存储数据的特点：有序、可重复，对于无序、不可重复的需求，则不能满足；

Java集合可分为Collection和Map两种体系

Collection接口：单列数据，定义了存取一组对象的方法的集合；

List：元素有序、可重复的集合；---->“动态”数组

ArrayList、LinkedList、Vector；

Set：元素无序、不可重复的集合；

HashSet、LinkedHashSet、TreeSet；

Map接口：双列数据，保存具有映射关系"key-value对"的集合；

HashMap、LinkedHashMap、TreeMap、Hashtable、Properties；

Collection接口中声明的方法的测试

向Collection接口的实现类的对象中添加数据obj时，要求obj所在类要重写equals（）。

public void test(){
    Collection coll = new ArrayList();
    coll.add(123);
    coll.add(456);
    coll.add(new String("Tom"));
    coll.add(new Person(Jerry,20));
    coll.add(false);
    
    //1.contains（Object obj）：判断当前集合中是否包含obj；
    //我们在判断时会调用obj对象所在类的equals（）；
    
    boolean contains = coll.contains(123);
    System.out.println(contains);//true
    
    System.out.println(coll.contains(new String("Tom")));//true
    
    System.out.println(coll.contains(new Preson(Jerry,20)));//Preson方法重写了就是true，否则就是false
    
    //2.CollectionsAll（Collections coll1）：判断形参coll1中的所有元素是否都存在于当前集合中；
    Collection coll1 = Arrays.asList(123,456);
    System.out.println(coll.containsAll(coll1));//true
    
    //3.remove(Object obj):从当前集合中移除obj元素；
    //4.removeAll(Collection coll)：从当前集合中移除coll中所有的元素；
}

集合元素的遍历操作，使用迭代器Iterator接口

//内部的方法：hasNext()和 next

//hasNext()判断是否还有下一个元素
while( iterator.hasNext() ){
    //next() 指针下移、将下移以后集合的位置上的元素返回
    System.oout.println( iterator.next( ) );
}

集合对象每次调用iterator（）方法都得到一个全新的迭代对象，默认游标都在集合的第一个元素之前；
内部定义了remove（），可以在遍历的时候，删除集合中的元素，此方法不同于集合直接调用remove（）；

for（集合元素的类型局部变量：集合对象），其内部仍然调用了迭代器；

ArrayList、LinkedList、Vector三者的异同？

相同点：三个类都实现了List接口，存储数据的特点相同：存储有序的、可重复的数据；
不同点

ArrayList：作为List接口的主要实现类：执行效率高，但线程不安全；底层使用Object[ ] elementData存储

LinkedList：对于频繁的插入、删除操作，使用此类效率比ArrayList高，底层使用的是双向链表存储；

Vector：作为List接口的古老实现类：执行效率低，但线程安全；底层使用Object[ ] elementData存储；

ArrayList的源码分析

jdk 7 情况下

ArrayList list = new ArrayList（）；//底层创建了长度是10的Object[ ]数组elementData

list.add（123）；//elementData[0] = new Integer（123）

…

list.add（11）；//如果此次的添加导致底层elementData数组容量不够，则扩容。

默认情况下，扩容为原来的容量的1.5倍，同时需要将原有数组中的数据复制到新的数组中；

结论：建议开发中使用带参的构造器：ArrayList list = new ArrayList（iint capacity）

jdk 8中ArrayList的变化

ArrayList list = new ArrayList（）；//底层Object[ ] elementData初始化为{ }，并没有创建长度为10的数组；

list.add（123）；//第一次调用add（）时，底层才创建长度为10的数组，并将数据123添加到elementData[0]

…

后续的添加和扩容操作与jdk 7 无异；

Vector源码分析

jdk 7 和 jdk 8中通过Vector（）构造器创建对象时，底层都创建了长度为10的数组；
在扩容方面，默认扩容为原来数组长度的2倍；

List的常用方法

void add (int index , Object ele)：在index位置插入ele元素；
boolean addALL（int index , Collection eles）：从index位置开始将eles中的所有元素添加进来；
Object get（int index）：获取指定index位置的元素；
int lastIndexOf（Object obj）：返回obj在当前集合中末次出现的位置；
Object remove（int index）：移除指定index位置的元素，并返回此元素；
Object set（int index ，Object ele）：设置指定index位置的元素为ele；
List subList（int fromIndex ，int toIndex）：返回fromIndex到toIndex位置的子集合；

Set接口

HashSet：作为Set接口的主要实现类：线程不安全；可以存储null值；
LinkedHashSet：作为HashSet的子类；遍历其内部数据时，可以按照添加的顺序遍历；
TreeSet：可以按照添加对象的指定元素，进行排序；
Set接口：存储无序的、不可重复的数据；

以HashSet为例：

无序性：不等于随机性。存储的数据在底层数组中并非按照数组索引的顺序添加，而是根据数据的哈希值决定的；
不可重复性：保证添加的元素按照equals（）判断时，不能返回true；

添加元素的过程：以HashSet为例：

我们向HashSet中添加元素a，首先调用元素a所在类的hashCode（）方法，计算元素a的哈希值，此哈希值接着通过某种算法计算出在HashSet底层数组中的存放位置（即：索引位置），判断数组此位置上是否已经有元素：

如果此位置上没有其他元素，则元素a添加成功； ---->情况1

如果此位置上有其他元素b（或以链表形式存在的多个元素），则比较元素a与元素b的hash值；

如果hash值不相同，则元素a添加成功；---->情况2

如果hash值相同，进而需要调用元素a所在类的equals（）方法；

equals（）返回true，元素a添加失败；

equals（）返回false，则元素a添加成功；----->情况3

对于添加成功的情况2和情况3而言：元素a与已经存在指定索引位置上数据以链表的方式存储；

jdk 7：元素a放到数组中，指向原来的元素；
jdk 8：原来的元素在数组中，指向元素a；
总而言之：七上八下