文章目录
一、 Java集合框架概述
1. 理解
(1)集合、数组都是对多个数据进行存储操作的结构,简称Java容器。
说明:此时的存储,主要指的是内存层面的存储,不涉及到持久化的存储(.text,.jpg,.avi,数据库中)。
(2)数组在存储多个数据方面的特点:
①优点:
> 数组初始化以后,长度就确定了。
> 数组声明的类型,就决定了进行元素初始化时的类型。如String arr[],int arr1[] 。
②弊端:
> 数组初始化以后,长度就不可变了,不便于扩展。
> 数组中提供的属性和方法少,不便于进行添加、删除、插入等操作,且效率不高。同时无法直接获取存储元素的个数。
> 数组存储的数据是有序的、可以重复的。对于无序、不可重复的需求不能满足。---->存储数据的特点单一 。
2.集合框架涉及到的API
Java 集合可分为 Collection 和 Map 两种体系。
(1)Collection接口:单列数据,定义了存取一组对象的方法的集合。
> List 接口:存储有序、可重复的数据。称为“动态”数组。主要有:Vector、 ArrayList、 LinkedList
> Set 接口:存储无序、不可重复的数据。类似高中数学的集合。主要有:HashSet、LinkedHashSet、TreeSet
(2)Map接口:双列数据,保存具有映射关系“key-value对”的集合。类似高中数学的函数。主要有:Hashtable、HashMap、Properties、 LinkedHashMap、 TreeMap
二、Collection接口中的方法
(1) add(Object obj):将元素obj添加到当前集合中
(2) addAll(Collection coll):将coll集合中的元素添加到当前的集合中。
(3)size():获取有效元素的个数
(4)clear():清空集合
(5)isEmpty():是否是空集合
(6)contains(Object obj):通过equals方法来判断当前集合是否包含obj。
(7)containsAll(Collection coll1):判断形参coll1中的所有元素是否都存在于当前集合中。
(8)remove(Object obj):从当前集合中移除 obj 元素。
(9)removeAll(Collection coll1):从当前集合中移除coll1中的所有元素。(相当于取两个集合的差集)
(10)retainAll(Collection coll1):获取当前集合和coll1集合的交集,并返回给当前集合。
(11)equals(Object obj):判断当前集合与形参集合的元素是否相同。
(12)hashCode():返回当前对象的哈希值。
(13)toArray():集合转换为数组。
(14)iterator():返回迭代器对象,用于集合遍历。(下节)
三、Iterator迭代器接口
1. 理解
(1)Iterator对象称为迭代器(设计模式的一种),主要用于遍历 Collection 集合中的元素。
(2)GOF给迭代器模式的定义为:提供一种方法访问一个容器(container)对象中各个元素,而又不需暴露该对象的内部细节。迭代器模式,就是为容器而生。类似于“公交车上的售票员”、“火车上的乘务员”、“空姐”。
(3) 集合对象每次调用iterator()方法都得到一个全新的迭代器对象,默认游标都在集合的第一个元素之前。
2. 主要方法
(1)hasNext():判断是否还有下一个元素。
(2)next():指针下移,将下移以后集合位置上的元素返回。
(3)remove():
> Iterator可以删除集合的元素,但是是遍历过程中通过迭代器对象的remove方法,不是集合对象的remove方法。
> 如果还未调用next()或在上一次调用 next 方法之后已经调用了 remove 方法,再调用remove都会报IllegalStateException。
3. foreach
(1)Java 5.0 提供了 foreach 循环迭代访问 Collection和数组。
(2)for(要遍历的集合元素的类型 遍历后自定义元素名称:要遍历的结构名称)
。
(3)foreach还可以用来遍历数组。
四、Collection子接口一:List接口
1. 概述
(1) 鉴于Java中数组用来存储数据的局限性,我们通常使用List替代数组。
(2) List集合类中元素有序、且可重复,集合中的每个元素都有其对应的顺序索引。
(3) List容器中的元素都对应一个整数型的序号记载其在容器中的位置,可以根据序号存取容器中的元素。
(4) JDK API中List接口的实现类常用的有:ArrayList、LinkedList和Vector。
2. List接口的常用实现类
(三者异同)
<1>
(1)ArrayList:作为List接口的主要实现类;线程不安全的,效率高;底层使用Object[ ] elementData 存储;
(2)LinkedList:对于频繁的插入、删除操作,使用此类效率比ArrayList高;底层使用双向链表存储;
(3)Vector:作为List接口的古老实现类;线程安全的,效率低;底层使用Object[ ] elementData 存储;
<2>源码
(1)ArrayList的JDK1.8之前与之后的实现区别?
JDK1.7:ArrayList像饿汉式,直接创建一个初始容量为10的数组。容量不够时,扩容为原来容量的1.5倍。
建议使用带参的构造器。
JDK1.8:ArrayList像懒汉式,一开始创建一个长度为0的数组,当添加第一个元素时再创建一个始容量为10的数组。扩容同上。延迟了数组创建,节省内存。
(2)LinkedList:双向链表,内部没有声明数组,而是定义了Node类型的first和last,用于记录首末元素。同时,定义内部类Node,作为LinkedList中保存数据的基本结构。Node除了保存数据,还定义了两个变量:
prev变量记录前一个元素的位置。
next变量记录下一个元素的位置。
(3)Vector 是一个古老的集合,JDK1.0就有了。大多数操作与ArrayList相同,区别之处在于Vector是线程安全的。
3. 接口方法
List除了从Collection集合继承的方法外,List 集合里添加了一些根据索引来操作集合元素的方法。
① void add(int index, Object ele):在index位置插入ele元素。
② boolean addAll(int index, Collection eles):从index位置开始将eles中的所有元素添加进来。
③ Object get(int index):获取指定index位置的元素。
④ int indexOf(Object obj):返回obj在集合中首次出现的位置。
⑤ int lastIndexOf(Object obj):返回obj在当前集合中末次出现的位置。
⑥ Object remove(int index):移除指定index位置的元素,并返回此元素。
⑦ Object set(int index, Object ele):设置指定index位置的元素为ele。
⑧ List subList(int fromIndex, int toIndex):返回从fromIndex到toIndex位置的子集合。
五、Collection子接口二:Set
1. 概述
(1) Set接口是Collection的子接口,set接口没有提供额外的方法(与list不同)。
(2) Set 集合不允许包含相同的元素,如果试把两个相同的元素加入同一个Set 集合中,则添加操作失败。
(3)Set 判断两个对象是否相同不是使用 == 运算符,而是根据 equals() 方法。
(4)Set存储无序的、不可重复的数据。
① 无序性不代表随机性,存储的数据在底层数组中并非按照数组索引的顺序添加,而是根据数据的哈希值决定的。
② 不可重复性:保证添加的元素按照 equals()判断时,不能返回true。即:相同的元素只能添加一个。
(5)添加元素的过程的具体过程(以HashSet为例):在向HashSet中添加元素a,首先调用元素a所在类的hashCode()方法,计算元素a的哈希值。此哈希值接着通过某种方法计算出在HashSet底层数组中存放的位置(通过某种散列函数决定),判断数组此位置上是否已经有元素:
1)如果此位置上没有其他元素,则元素a添加成功;
2)如果此位置上有其他元素b(或以链表形式存在的多个元素),则比较a和b的hash值:
① 如果 hash值不相同,则元素a添加成功;
② 如果 hash值相同,进而需要调用元素a所在类的equals()方法:equals()返回true,元素a添加失败;equals()返回false,元素a添加成功。
对于添加成功的情况来说,元素 a 与已经存在指定索引位置上的数据以链表的形式存储。jdk 7:元素a 放到数组中,指向原来的元素;jdk 8:原来的元素在数组中,指向元素 a 。(七上八下)
(6)HashSet 集合判断两个元素相等的标准:两个对象通过 hashCode() 方法比较相等,并且两个对象的 equals() 方法返回值也相等。
(7)对于存放在Set容器中的对象,对应的类一定要重写equals()和hashCode(Object obj)方法,以实现对象相等规则。即:“相等的对象必须具有相等的散列码”。否则会调用object中的hashCode方法,随机得出哈希值,这样可能导致两个相同的对象得到不同的哈希值从而在set中出现重复对象。
2. Set 接口的常用实现类
(1)HashSet:作为Set接口的主要实现类;线程不安全的;可以存储null值。底层是数组+链表。
(2)LinkedHashSet:作为HashSet的子类;遍历其内部数据时,可以按照添加的顺序遍历;在添加数据的同时,每个数据还维护了两个引用,记录此数据前一个和后一个数据。对于频繁的遍历操作,LinkedHashSet效率高于HashSet。
(3)TreeSet:可以按照添加对象的指定属性进行排序。向TreeSet中添加的数据,要求是相同类的对象。有两种排序方式:
① 自然排序:TreeSet 会调用集合元素的 compareTo(Object obj) 方法来比较元素之间的大小关系,然后将集合元素按升序(默认情况)排列。比较两个对象是否相同的标准为 compareTo()返回0,而不是equals()。
② 定制排序:通过Comparator接口来实现。比较两个对象是否相同的标准为 compare()返回0,而不是equals()。
六、Map接口
1. 概述
(1)Map与Collection并列存在。用于保存具有映射关系的数据:key-value。类似于高中的函数:y=f(x)(y→value,x→key)
(2)Map结构的理解:
① Map中的key:无序的、不可重复的,使用Set存储所有的key 。(key所在的类要重写 equals()和 hashCode()方法。(以HashMap为例))
② Map中的value:无序的、可重复的,使用Collection存储所有的value。(value所在的类要重写 equals())。一个键值对:key-value 构成了一个Entry 对象。
③ Map中的entry:无序的、不可重复的,使用Set存储所有的Entry。
2. Map 接口的常用实现类
(1)HashMap:作为Map的主要实现类;线程不安全的,效率高;存储null 的 key 和 value 。
底层:
数组+链表(jdk 7及之前)
数组+链表+红黑树(jdk 8)
(2)LinkedHashMap:保证在遍历map元素时,可以按照添加的顺序实现遍历。原因:在原有的HashMap底层结构基础上,添加了一对指针,指向前一个和后一个元素。对于频繁的遍历操作,此类执行效率高于HashMap。
(3)TreeMap:保证按照添加的key-value对进行排序,实现排序遍历。此时考虑key的自然排序或定制排序。底层使用红黑树。
(4)Hashtable:作为古老的实现类;线程安全的,效率低;不能存储null的key和value。
(5)Properties:常用来处理配置文件。key和value都是String类型。
3. HashMap的底层实现原理
(以 jdk 7为例)
HashMap map=new HashMap();
在实例化以后,底层创建了长度为16的一维数组 Entry[ ] table
map.put(key1,value1)
:把key1,value1放到上述数组中
① 首先,调用key1所在类的hashCode()计算key1的哈希值,此哈希值经过某种算法计算以后,得到在Entry数组中的存放位置:
② 如果此位置上的数据为空,此时key1-value1添加成功;如果此位置上的数据不为空(意味着此位置上存在一个或多个数据(以链表形式存在)),比较key1和已经存在的一个或多个数据的哈希值:
③ 如果key1的哈希值和已经存在的数据的哈希值都不相同,此时key1-value1添加成功;如果key1和已经存在的某一个数据(key2-value2)的哈希值相同,继续比较:
④ 调用key1所在类的equals():如果equals()返回false,此时key1-value1添加成功;如果equals()返回true,使用value1替换value2。
补充:① 添加成功的情况,此时key1-value1和原来的数据以链表的方式存储。② 在不断添加的过程中,会涉及到扩容问题,当超出临界值12(且要存放的位置非空)时扩容,默认的扩容方式:扩容为原来容量的2倍,并将原来的数据复制过来。
jdk 8 相较于jdk 7 在底层实现方面的不同:
(1)new HashMap():底层没有创建一个长度为16的数组。
(2)jdk 8 底层的数组是 Node[ ],而非 Entry[ ] 。
(3)首次调用put()方法时,底层创建长度为16的数组。
(4)jdk 7 底层结构只有:数组+链表。jdk 8 中底层结构:数组+链表+红黑树。当数组的某一个索引位置上的元素以链表形式存在的数据个数>8 且当数组的长度>64时,此时此索引位置上的所有数据改为使用红黑树存储。
相关含义:
DEFAULT_INITIAL_CAPACITY:HashMap的默认容量,16;
DEFAULT_LOAD_FACTOR:HashMap的默认加载因子:0.75;
threshold:扩容的临界值,=容量 × 加载因子:16 * 0.75=12;
TREEIFY_THRESHOLD:Bucket中链表长度大于该默认值,转化为红黑树:8;
MIN_TREEIFY_CAPACITY:桶中的Node被树化时最小的hash表容量:64
4. 常用方法
(1)添加、删除、修改操作:
Object put(Object key,Object value):将指定key-value添加到(或修改)当前map对象中
void putAll(Map m):将m中的所有key-value对存放到当前map中
Object remove(Object key):移除指定key的key-value对,并返回value
void clear():清空当前map中的所有数据
(2)元素查询的操作:
Object get(Object key):获取指定key对应的value
boolean containsKey(Object key):是否包含指定的key
boolean containsValue(Object value):是否包含指定的value
int size():返回map中key-value对的个数
boolean isEmpty():判断当前map是否为空
boolean equals(Object obj):判断当前map和参数对象obj是否相等
(3)元视图操作的方法:
Set keySet():返回所有key构成的Set集合
Collection values():返回所有value构成的Collection集合
Set entrySet():返回所有key-value对构成的Set集合
map没有iterator方法,遍历时可以用以上方法得到set或者Collection,再用他们的iterator方法,即可实现遍历。如:
七、Collections工具类
1. 概述
(1)Collections 是一个操作 Set、List 和 Map 等集合的工具类。
(2)Collections 中提供了一系列静态的方法对集合元素进行排序、查询和修改等操作,还提供了对集合对象设置不可变、对集合对象实现同步控制等方法。
2. 常用方法
(1)排序操作:(均为static方法)
reverse(List):反转 List 中元素的顺序
shuffle(List):对 List 集合元素进行随机排序
sort(List):根据元素的自然顺序对指定 List 集合元素按升序排序
sort(List,Comparator):根据指定的 Comparator 产生的顺序对 List 集合元素进行排序
swap(List,int, int):将指定 list 集合中的 i 处元素和 j 处元素进行交换
(2)查找、替换
Object max(Collection):根据元素的自然顺序,返回给定集合中的最大元素
Object max(Collection,Comparator):根据 Comparator 指定的顺序,返回给定集合中的最大元素
Object min(Collection)
Object min(Collection,Comparator)
int frequency(Collection,Object):返回指定集合中指定元素的出现次数
void copy(List dest,List src):将src中的内容复制到dest中
boolean replaceAll(List list,Object oldVal,Object newVal):使用新值替换List 对象的所有旧值