数组的特点:
①长度是固定的;②需要额外的变量来记录数组的有效元素个数。
所以如果要对数组进行扩容,或者要维护元素的个数,都需要做大量的工作。
所以Java提供了容器,统称为集合。每一种集合都有自己的特点,适用于特定的类型。
数据存储的物理结构
不论多复杂的存储方式,其最基本的物理结构都是基于两种:
- 连续的存储空间:数组
元素是相邻的,在内存中需要开辟连续的存储空间。必须明确,数组的存储一定是线性的
优点:访问速度比较快。因为有了首地址,可以根据下标直接找到对应的元素
缺点:内存紧张的时候,寻找一整块连续的存储空间较为困难
- 非连续的存储空间:链式
元素不一定是相邻的,在内存中不需要开辟连续的存储空间。
优点:不要求空间连续
缺点:访问速度相对数组比较慢,要从头挨个遍历
线性与非线性
- 线性:数组、链表、队列、栈
- 非线性:数(二叉树)、图
Collection和Map
Collection
规范单值集合的接口
Map
键值对集合的接口
一、Collection
Collection是根接口,它没有直接的实现类,有更具体的子接口:List和Set等
API
遍历
-
Object[] toArray():先返回数组,然后遍历数组
-
迭代器设计模式
每一个Collection系列的集合,内部都自带一个迭代器。
java.util.Iterator
也是个接口,它是所有迭代器的标准接口。
这个接口的实现类在每一种集合类中,例如ArrayList
内部有一个内部类实现了Iterator
接口。
这里声明为内部类有两个原因:
- 每一种集合的内部实现(物理结构)不同,意味着迭代器的实现是不同的,每一种集合都要单独定制迭代器。
- 内部类可以直接访问外部类的私有属性、成员,迭代器可以直接访问其私有的元素。
foreach
循环:增强for循环
foreach
可以用于遍历数组、Collection
系列的集合等容器。
语法结构:
for(元素类型 元素临时名称: 数组或集合名){
}
Collection c = new ArrayList();
c.add("张三");
c.add("李四");
c.add("王五");
for (Object object : c) {
System.out.println(object);
}
什么样的集合或者容器可以使用foreach
循环??
凡是实现了java.lang.Iterable
接口的集合或容器都支持foreach
foreach
底层还是调用Iterator
迭代器遍历集合
二、List
Collection
是根接口,没有提供任何直接实现,它有一些更具体地子接口,例如:List和Set。
List系列的集合中的元素为有序的、可重复的。
List系列的集合:ArrayList
(动态数组)、Vector
(动态数组、向量类)、LinkedList
(双向链表、双端队列、栈…)、Stack
(栈)
虽然List系列的集合都是可以通过索引/下表进行操作的,但是像LinkedList这类的集合,其实不建议使用和索引相关的方法进行操作,因为它们的底层物理结构不是数组,如果通过索引操作,会需要从头到尾遍历找到对应的索引,效率并不高。
1.API
而对于ListIterator
,它也多出来了许多API,如下:
public class TestList01 {
public static void main(String[] args) {
List list = new ArrayList();
list.add("张三");
list.add(0,"李四");
list.add(1);
list.add(2);
list.add(3);
for (Object object : list) {
System.out.println(object + ":" + object.getClass());
}
list.remove(new Integer(1));//删除的时候必须用对象
}
}
//李四:class java.lang.String
//张三:class java.lang.String
//1:class java.lang.Integer
//2:class java.lang.Integer
//3:class java.lang.Integer
必须清楚,List中不能存放基本数据类型,只能存放对象。
2.List接口的实现类
1.Vector:动态数组,物理结构:数组
2.ArrayList:动态数组,物理结构:数组
3.Stack:栈,它是Vector的子类,物理结构:数组
4.LinkedList:双向链表,物理结构:链表
Vector和ArrayList的区别
Vector:最早版本的动态数组(旧版),线程安全的(即有线程同步),不够后扩容为原来的2倍。Vector支持的遍历集合的方式有:(1)foreach(2)Iterator(3)支持旧版的Enumeration
迭代器
ArrayList:相对Vector来说新一点,线程不安全(没有线程同步),容量不够后扩容为原来的1.5倍。ArrayList支持的遍历集合的方式有:(1)foreach(2)Iterator
Vector和ArrayList在使用时,为了避免空间浪费和扩容次数太多,如果能够预估大概的元素个数,那么可以用ArrayList(int initialCapacity)
和Vector(int initialCapacity)
直接初始化为一定容量的数组。
Stack
先进后出(FILO)或者后进先出(LIFO:last in first out)
Stack是Vector的子类,比Vector多了几个方法,它的后进先出的特征,就是通过调用这几个方法实现的。
- 这里的push和add功能完全一样,只是push更形象。
LinkedList
内部有一个节点的类型,类似如下格式:
class Node{
Object data;
Node previous;
Node next;
}
而LinkedList的结构一定有以下内容:
class LinkedList{
Node first; //记录第一个结点的地址
Node last;//记录最后一个结点的地址
}
//空链表:if(first == null && last == null)
//有一个结点:first == last
//第一个结点:first.previous == null
//最后一个结点:last.next == null
LinkedList
可以被当作双向链表、栈、队列、双端队列等数据结构使用。
首先明确一点,JAVA中体现某一功能一定是通过方法来实现的。
如何体现双向链表?
E getFirst()
E getLast()
boolean offerFirst(E e)
:添加到第一个boolean offerLast(E e)
:添加到最后一个int indexOf(Object o)
:从first开始找int lastIndexOf(Object o)
:从last开始找E get(int index)
: 先判断index是靠前还是靠后,然后再开始查找
如何体现栈?
E peek()
E pop()
void push(E e)
如何体现队列?
队列:先进先出
LinkedList
实现了Queue
接口
在处理元素前用于保存元素的 collection。除了基本的 Collection
操作外,队列还提供其他的插入、提取和检查操作。每个方法都存在两种形式:一种抛出异常(操作失败时),另一种返回一个特殊值(null
或 false
,具体取决于操作)。插入操作的后一种形式是用于专门为有容量限制的 Queue
实现设计的;在大多数实现中,插入操作不会失败。
如何体现双端队列?
LinkedList
实现了Deque
的接口
此接口定义在双端队列两端访问元素的方法。提供插入、移除和检查元素的方法。每种方法都存在两种形式:一种形式在操作失败时抛出异常,另一种形式返回一个特殊值(null
或 false
,具体取决于操作)。插入操作的后一种形式是专为使用有容量限制的 Deque
实现设计的;在大多数实现中,插入操作不能失败。
三、Set
Set系列的集合的元素是不能重复的。
Set的实现类:HashSet
、TreeSet
、LinkedHashSet
我们所说的List有序,是指List有先后顺序,可能是[下标]索引顺序,也可以是链表的next,prev的引用顺序。
而在Set中,如果按照元素的存储顺序来说,有一些Set可以保证,有一些Set不能保证,只有LinkedHashSet能保证元素添加的顺序;而对于元素的大小顺序来说,有一些Set可以保证,有一些Set不能保证,只有TreeSet可以保证元素的大小顺序。而HashSet既不能保证添加顺序,又不能保证大小顺序,是完全无序的。
Set
接口没有增加方法,都是从Collection
接口中继承的。
HashSet与LinkedHashSet
HashSet
:完全无序
LinkedHashSet
:按照添加顺序
LinkedHashSet
是HashSet
的子类,比HashSet
多维护了添加的顺序。
当即想要实现元素的不可重复性,又想要保证元素的添加顺序,就必须使用LinkedHashSet,否则就用List
系列或者HashSet
。
由于LinkedHashSet要维护添加顺序,所以其效率较低。
HashSet
与TreeSet
HashSet
:完全无序
TreeSet
:大小顺序
当需要元素不可重复,又要给元素排大小顺序的时候,就用TreeSet
要用到TreeSet
,一定要用到java.lang.Comparable
或者java.util.Comparator
在构造TreeSet
的时候,可以传入一个Comparator
对象
如何保证元素是不可重复的?
HashSet
和LinkedHashSet
- 先比较hash值,如果hash值不一样,说明一定不相同
- 如果hash值一样,再调用equals方法比较
TreeSet
- 并不会调用equals和hashcode,大小相同即相同元素
四、Map
任意的引用数据类型都可以作为key和value
虽然key也可以是任意类型的对象,但是习惯上key通常是String或者Integer
因为String和Integer比较简洁,而且对象不可变
API
- Map接口没有继承java.lang.Iterator接口,所以不能直接使用foreach循环进行遍历。
- Map接口中也没有提供
Iterator iterator()
方法返回迭代器对象
遍历
- 获取所有的Key,然后遍历
Set keys == map.keySet();
for (Object obj : keys){
System.out.println(key + "->" + map.get(key));//通过key得到value
}
- 获取所有的value,然后遍历
Collection values = map.values;
for (Object obj : values){
System.out.println(value);
}
- 获取所有的映射关系,然后遍历,此时把一对映射关系
(key,value)
看成一个整体,是Entry类型的对象
Set entrySet = map.entrySet();
for (Object obj : entrySet){
System.out.println(entry);
}
实现类
- HashMap
- Hashtable
- TreeMap
- LinkedHashMap
- Properties
HashMap和Hashtable 哈希表
Hashtable
:旧版。线程安全的。它的key和value不能为null。
HashMap
:相对Hashtable
它来说新一点。线程不安全。它允许key和value为null值。
HashMap和LinkedHashMap
LinkedHashMap
是HashMap
的子类,比HashMap
多维护了映射关系的添加顺序。
HashMap
:无序的。
LinkedHashMap
:可以记录添加顺序。
LinkedHashMap
比HashMap
要做的事多,效率低。只在需要维护顺序时再使用它。
HashMap和TreeMap
HashMap
:无序的。
TreeMap
:按照key排大小顺序。
Properties
Properties
是Hashtable
的子类,不允许key和value是null,并且它的key和value的类型都是String。
通常用于存储配置属性。
而且为了可读性更好,还增加了两个方法:
setProperty(key,value)
String getProperty(key)
所有的map的key不能重复,如何实现不重复?
HashMap、Hashtable、LinkedHashMap、Properties:依据key的hashCode和equals方法
TreeMap:依据key的大小,认为大小相等的两个key就是重复的
如果key重复了,那么后面的value会替换原来的value。
TreeMap要让key排大小,要么key类型本身实现了java.lang.Comparable接口,要么在创建TreeMap时,指定一个java.util.Comparator接口的实现类对象。