目录
面试题:ArrayList、LinkedList、Vector有何异同?
比较HashSet、LinkedHashSet、TreeSet
Collection子接口之一:List接口
List接口概述
鉴于Java中数组用来存储数据的局限性,我们通常使用List替代数组
List集合类中元素有序、且可重复,集合中的每个元素都有其对应的顺序索引。
List容器中的元素都对应一个整数型的序号记载其在容器中的位置,可以根据 序号存取容器中的元素。
JDK API中List接口的实现类常用的有:ArrayList、LinkedList和Vector。
List接口方法
List除了从Collection集合继承的方法外,List 集合里添加了一些根据索引来操作集合元素的方法。
void add(int index, Object ele):在index位置插入ele元素
boolean addAll(int index, Collection eles):从index位置开始将eles中 的所有元素添加进来 Object get(int index):获取指定index位置的元素
int indexOf(Object obj):返回obj在集合中首次出现的位置
int lastIndexOf(Object obj):返回obj在当前集合中末次出现的位置
Object remove(int index):移除指定index位置的元素,并返回此元素(重载)
Object set(int index, Object ele):设置指定index位置的元素为ele
List subList(int fromIndex, int toIndex):返回从fromIndex到toIndex位置的子集合(左闭右开,不会对本身list集合造成影响)
List实现类之一:ArrayList
ArrayList 是 List 接口的典型实现类、主要实现类
本质上,ArrayList是对象引用的一个”变长”数组
ArrayList的JDK1.8之前与之后的实现区别?
JDK1.7:ArrayList像饿汉式,直接创建一个初始容量为10的数组
JDK1.8:ArrayList像懒汉式,一开始创建一个长度为0的数组,当添加第一个元素时再创建一个始容量为10的数组
Arrays.asList(…) 方法返回的 List 集合,既不是 ArrayList 实例,也不是 Vector 实例。 Arrays.asList(…) 返回值是一个固定长度的 List 集合
ArrayList源码分析
jdk7.0的情况:
1.观察构造器(创建ArrayList对象):
ArrayList list=newArrayList();
直接在底层创建了长度为10的Object[] 数组 elementData
2.调用add()方法:
list.add(123); //elementData[0]=new Integer(123);
...
list.add("AA");
如果此时添加成员导致底层elementData数组容量不够则进行扩容,默认情况下扩容为原来的1.5倍,同时需要将原有数组中的数据复制到新的数组中去
结论:建议使用代参数的构造器:ArrayList list=new ArrayList(int capacity);
jdk8的情况:
1.观察构造器(创建ArrayList对象)
ArrayList list=new ArrayList();
底层Object[] elementData初始化为{},并没有创建长度为10的数组
2.调用add()方法:
list.add(123);//第一次调用add()方法时会在底层创建长度为10的数组,并将数据123添加到elementData中
...(后续添加与jdk7.0无异)
结论:jdk7中ArrayList对象的创建类似于单例饿汉式,jdk8中的ArrayList像单例懒汉式,延迟了数组的创建,节省内存
List实现类之二:LinkedList
LinkedList:双向链表,内部没有声明数组,而是定义了Node类型的first和last, 用于记录首末元素。同时,定义内部类Node,作为LinkedList中保存数据的基本结构。Node除了保存数据,还定义了两个变量:
prev变量记录前一个元素的位置
next变量记录下一个元素的位置
对于频繁的插入或删除元素的操作,建议使用LinkedList类,效率较高
LinkedList源码分析
1.创建LinkedList对象:
LlinkedList list=new LinkedList();
内部声明了Node类型的first和last属性,默认值为null
2.调用add()方法:
list.add(123);//将123封装到Node中,创建Node对象
其中Node定义为:
List实现类之三:Vector
Vector 是一个古老的集合,JDK1.0就有了。大多数操作与ArrayList 相同,区别之处在于Vector是线程安全的。
在各种list中,最好把ArrayList作为缺省选择。当插入、删除频繁时, 使用LinkedList;Vector总是比ArrayList慢,所以尽量避免使用。
面试题:ArrayList、LinkedList、Vector有何异同?
相同点
都实现了List接口,存储数据的特点相同:有序、可重复
不同点
ArrayList:List的接口的主要实现类,线程不安全,效率高,底层用Object[]存储
LinkedList:对于频繁的删除、插入操作,使用此类效率比ArrayList效率高,底层使用双向链表存储
Vector:List接口的古老实现类,线程安全,效率低,底层用Object[]存储。Vector每次扩容时容量扩充为原来的2倍。
Collection子接口之二:Set接口
Set接口是Collection的子接口,set接口没有提供额外的方法(使用的都是Collection中声明过的)
Set 集合不允许包含相同的元素,如果试把两个相同的元素加入同一个 Set 集合中,则添加操作失败。(存放无序、不可重复的元素)
Set 判断两个对象是否相同不是使用 == 运算符,而是根据 equals() 方法
要求:
1、向Set中添加数据,其所在类必须重写hashcode()和equals()方法
2、重写hashCode()和equals()方法必须保持一致性:相等的对象必须具有相等的散列值
Set的实现类之一:HashSet
HashSet 是 Set 接口的典型实现,大多数时候使用 Set 集合时都使用这个实现类。
HashSet 按 Hash 算法来存储集合中的元素,因此具有很好的存取、查找、删除 性能。
HashSet 具有以下特点:
1.不能保证元素的排列顺序(根据元素哈希值进行排列)
2.HashSet 不是线程安全的
3.集合元素可以是 null
4.底层是以数组+链表形式存储数据的
以HashSet为例理解Set接口的无序、不可重复性
无序性
无序性不等于随机性,存储的数据并非按照数组索引的顺序添加,而是根据数据的哈希值进行存储
不可重复性
保证添加的元素按照equals()判断时,不能返回true,即:相同的元素只能添加一次
向HashSet中添加元素过程
当向HashSet中添加一个元素时,首先调用该元素的HashCode()方法,计算该元素的哈希值,次哈希值通过某种种散列函数计算出元素在HashSet底层数组中存储的位置(这个散列函数会与底层数组的长度相计算得到在数组中的下标,并且这种散列函数计算还尽可能保证能均匀存储元素,越是散列分布, 该散列函数设计的越好),判断数组此位置上是否有元素,如果此位置上没有其他元素,则元素添加成功。(情况一)
若此位置上有其他一个或多个元素,则比较元素的哈希值:
如果该元素与其他元素哈希值不相等,则该元素添加成功(以链表形式)(情况二)
如果该元素与其他元素哈希值相等,则需要调用该元素所在类的equals()方法:
若equals()返回true,则添加失败;
若equals()返回false,则添加成功;(情况三)
注:
对于情况二、三 而言,要添加的元素与已经存在的在指定索引位置上的元素的数据以链表的方式存储;
jdk7:元素放到数组中,指向原来的元素;
jdk8中:原来的元素在数组中,指向要存放的元素
(七上八下)
Set实现类之二:LinkedHashSet
LinkedHashSet 是 HashSet 的子类
LinkedHashSet 根据元素的 hashCode 值来决定元素的存储位置, 但它同时使用双向链表维护元素的次序,这使得元素看起来是以插入顺序保存的。
LinkedHashSet插入性能略低于 HashSet,但在迭代访问 Set 里的全部元素时有很好的性能。 LinkedHashSet 不允许集合元素重复。
LinkedHashSet作为HashSet的子类,在添加数据的同时,每个数据还维护了两个引用,记录此数据的前一个数据和后一个数据
对于频繁的遍历操作,LinkedHashSet效率由于HashSet
Set实现类之三:TreeSet
TreeSet 是 SortedSet 接口的实现类,TreeSet 可以确保集合元素处于排序状态。
TreeSet底层使用红黑树结构存储数据
向TreeSet中添加数据,要求是添加向同类的对象
TreeSet两种排序方法:自然排序和定制排序
在定制排序中,比较两个对象是否相同的标准为:compare()返回0,不再是看equals()
在自然排序中,比较两个对象是否相同的标准为:compareTo()返回0,不再是看equals()
默认情况下,TreeSet采用自然排序。
排序
比较HashSet、LinkedHashSet、TreeSet
HashSet:作为Set的主要实现类,线程不安全,可以存储null值
LinkedHashSet:作为HashSet的子类,在此基础上添加前后指针:遍历内部数据时可以安添加的顺序遍历
TreeSet:底层使用二叉树存储;可以按照添加对象的指定属性排序