目录
首先我们从Collection和Collections入手讲解集合
1.Collection 与Collections的区别
java.util.Collections 是一个包装类。它包含有各种有关集合操作的 静态多态方法。此类 不能实例化,就像一 个工具类,服务于Java的Collection框架。 他提供一系列静态方法实现对各种集合的搜索、排序、线程安全化等操作。
java.util.Collection 是一个 集合框架的父接口。它提供了对集合对象进行基本操作的通用接口方法。Collection接口在Java 类库中有很多具体的实现。Collection接口的意义是为各种具体的集合提供了最大化的统一操作方式。
2.Collection下的接口:
1. List 元素有序,可重复。
存储和取出元素的顺序是相同的,允许有重复的元素,有索引可以进行for循环遍历,可以通过索引来访问集合中的元素.
实现类的区别如下:
1.ArrayList
优点: 底层数据结构是数组,(默认大小10,扩容是原来的1.5倍)查询快,增删慢。
缺点: 线程不安全,效率高
2.LinkedList
优点: 底层数据结构是链表,查询慢,增删快。
缺点: 线程不安全,效率高
3.Vector(目前几乎不用了)
优点: 底层数据结构是数组,(默认大小10,扩容是原来的2倍,增删查询效率都不高)查询快,增删慢。
缺点: 线程安全,效率低
4、ArrayList 与 Vector 区别
Vector类的所有方法都是同步的。可以由两个线程安全地访问一个Vector对象、但是一个线程访问Vector代码要在同步操作上耗费大量的时间。Arraylist不是同步的,所以在不需要同步时建议使用Arraylist
2、Set 元素无序,不可重复
1.HashSet
底层数据结构是哈希表。(无序,唯一)
如何来保证元素唯一性?
依赖两个方法:hashCode()和equals()
(1)HashSet如何检查重复?
当你把对象加入HashSet时,HashSet会先计算对象的hashcode值来判断对象加入的位置,同时也会与其他加入的对象的hashcode值作比较,如果没有相符的hashcode,HashSet会假设对象没有重复出现。但是如果发现有相同hashcode值的对象,这时会调用equals()方法来检查hashcode相等的对象是否真的相同。如果两者相同,HashSet就不会让加入操作成功
(2)hashCode()与equals()的相关规定:
(2.1)如果两个对象相等,则hashcode一定也是相同的
(2.2)两个对象相等,对两个equals方法返回true
(2.3)两个对象有相同的hashcode值,它们也不一定是相等的
(2.4)综上,equals方法被覆盖过,则hashCode方法也必须被覆盖
(2.5)hashCode()的默认行为是对堆上的对象产生独特值。如果没有重写hashCode(),则该class的两个对象无论如何都不会相等(即使这两个对象指向相同的数据)。
(3)==与equals的区别
(3.1)==是判断两个变量或实例是不是指向同一个内存空间 equals是判断两个变量或实例所指向的内存空间的值是不是相同
(3.2)==是指对内存地址进行比较 equals()是对字符串的内容进行比较
(3.3)==指引用是否相同 equals()指的是内容是否相同
2.TreeSet
底层数据结构是红黑树。(唯一,特定顺序存储数据)
(1)如何保证元素排序的呢?
自然排序或者比较器排序
(2)如何保证元素唯一性的呢?
根据比较的返回值是否是0来决定
3.LinkedHashSet
底层数据结构是链表和哈希表。(FIFO插入有序,唯一)
(1)由链表保证元素有序
(2)由哈希表保证元素唯一
3、栈
栈:一种特殊的线性表,其只允许在固定的一端进行插入和删除元素操作。进行数据插入和删除操作的一端称为栈顶,另一端称为栈底。
栈中的数据元素遵守后进先出LIFO(Last In First Out)的原则。
1)常见的栈操作:
push为入栈,为栈顶添加新元素。
pop为出栈,删除栈顶元素。
peek为查看栈顶元素。
isEmpty为判断栈是否为空。
size可得到栈的元素个数。
4、队列
队列:只允许在一端进行插入数据操作,在另一端进行删除数据操作的特殊线性表,队列具有先进先出FIFO(First In First Out)
队列的常用操作:
add,offer:入队,这两个函数都是入队,区别在于,add入队时发生异常会抛出异常,offer则会返回特殊值。
remove,poll:出队,区别同上。
element,peek:查看队首元素,区别同上。
2、map
map没有继承Collection接口,Map提供key到value的映射。一个Map中不能包含相同的key,每个key只能映射一个value。
1.HashMap集合
底层是一个哈希表(数组+链表/红黑)),是一个线程不安全的集合,是多线程的集合
HashMap可以存储null值,null键
2.LinkedHashMap集合
底层原理 哈希表+链表,有序(key不能重复)
3.Hashtable集合
底层也是一个哈希表(基于红黑树实现的),是一个线程安全的集合,单线程,速度慢
Hashtable不可以存储null值,null键
Hashtable的子类Properties集合是唯一与IO流结合的集
面试题
1.HashMap与HashTable的区别?
答:
HashMap没有考虑同步,是线程不安全的;Hashtable使用了synchronized关键字,是线程安全的;
HashMap允许K/V都为null;hashtable后者K/V都不允许为null;
HashMap继承自AbstractMap类;而Hashtable继承自Dictionary类;
2.如何决定选用HashMap还是TreeMap?
对于在Map中插入、删除和定位元素这类操作,HashMap是最好的选择。然而,假如你需要对一个有序的key集合进行遍历,TreeMap是更好的选择。基于你的collection的大小,也许向HashMap中添加元素会更快,将map换为TreeMap进行有序key的遍历。
3.ArrayList和Vector有何异同点?
ArrayList和Vector在很多时候都很类似。
(1)两者都是基于索引的,内部由一个数组支持。
(2)两者维护插入的顺序,我们可以根据插入顺序来获取元素。
(3)ArrayList和Vector的迭代器实现都是fail-fast的。
(4)ArrayList和Vector两者允许null值,也可以使用索引值对元素进行随机访问。
以下是ArrayList和Vector的不同点。
(1)Vector是同步的,而ArrayList不是。然而,如果你寻求在迭代的时候对列表进行改变,你应该使用CopyOnWriteArrayList。
(2)ArrayList比Vector快,它因为有同步,不会过载。
(3)ArrayList更加通用,因为我们可以使用Collections工具类轻易地获取同步列表和只读列表
4.ArrayList和LinkedList有何区别?
ArrayList和LinkedList两者都实现了List接口,但是它们之间有些不同。
(1)ArrayList是由Array所支持的基于一个索引的数据结构,所以它提供对元素的随机访问,复杂度为O(1),但LinkedList存储一系列的节点数据,每个节点都与前一个和下一个节点相连接。所以,尽管有使用索引获取元素的方法,内部实现是从起始点开始遍历,遍历到索引的节点然后返回元素,时间复杂度为O(n),比ArrayList要慢。
(2)与ArrayList相比,在LinkedList中插入、添加和删除一个元素会更快,因为在一个元素被插入到中间的时候,不会涉及改变数组的大小,或更新索引。
(3)LinkedList比ArrayList消耗更多的内存,因为LinkedList中的每个节点存储了前后节点的引用。
• Linkedlist是底层:双向链表
在ArrayList中增加或者删除某个元素,通常会调用System.arraycopy方法,这是一种极为消耗资源的操作,因此,在频繁的插入或者是删除元素的情况下,LinkedList的性能会更加好一点。