集合

最新推荐文章于 2023-06-15 00:01:23 发布

qq_3197644270

最新推荐文章于 2023-06-15 00:01:23 发布

阅读量124

点赞数

本文链接：https://blog.csdn.net/qq_42721743/article/details/81840312

版权

集合概念:
用于存储多个对象的单一对象(容器)。存储的数据叫元素。元素都是引用类型。（容器内存储的都是对象的地址）

集合框架中包含多种接口，抽象类，实现类等,用此来满足我们，所需要的用于存储数据的数据结构。

JDK1.5新特性:
在1.5以前，容器可以存储Object的任何子类型，但是在对元素进行操作时，比如调用元素的方法等。我们必需知道元素的类型，因此在编程中增加了大量代码，来进行强制转换，增加了开发难度。因此1.5开始支持了一个新特性，叫泛型机制。用来规定容器中存储的元素的类型。此机制可以在编译期间就进行判断元素的类型。
===============================================================
泛型机制:
(1)概念
               jdk1.5版本开始使用的新特性,本质是进行"参数化类型",在类，接口，方法的定义上都可以使用，用来指定数据类型名的。
(2)集合在定义时，可以用泛型机制来指定元素的类型，这样编译器在编译期间就可以进行检查元素类型是否匹配，
       避免了程序在运行时出现过多的错误
(3)集合框架中的所有类型(接口，抽象类，实现类)都是用了泛型机制
(4)泛型机制的参数只能传引用类型。
==============================================================
集合与数组的区别：
相同点:都是容器(数据结构)，用来存储多个数据的，
不同点：
数组:可以存储基本数据类型
集合:只能存储引用数据类型

Collection与Collections的区别
Collection:是集合的父接口，定义了集合框架中常用的抽象方法
Collections:是集合的工具类，定义了很多用于操作集合对象的工厂/工具方法

Collection接口：
是集合框架的顶级父接口,用来定义常用的抽象方法。子类需要实现相应的方法逻辑。

常用方法:
boolean add(E e):                               将对象e添加到集合中
int size() ：                                 返回集合元素的个数
boolean addAll(Collection c)：           将集合c里的元素添加到此集合中
void clear()：                             清空集合元素
boolean contains(Object obj)：           用于判断集合中是否存在于obj相同的元素
boolean containsAll(Collection c) ：用于判断此集合中是否包含集合c中的所有元素
boolean isEmpty():                               用于判断集合元素是否为空
boolean remove(Object o)   ：               用于移除集合中的某一元素
boolean removeAll(Collection c)：   用于移除此集合中与c中共有元素
boolean retainAll(Collection c);        用于保留此集合中与c中共有元素

子接口：List与Set,Queue
一、List：列表
存储此接口实现类的数据，有序，可重复。能存储null元素，没有个数限制
有序:存储时与添加的顺序相关。有对应的索引/下标标记位置。从0开始
重复:存储的元素可以是同一个，也可以是对象内容相同不同对象。根据元素的equals方法进行判断

常用方法：
void add(int index,E element) ：将某一元素，插入到此集合的下标index处。
boolean remove(int index)：   移除此集合中下标为index上的元素
E get(int index)   ：                       返回指定下标上的元素
E set(int index,E newElement)：使用新元素newElement替换下标index上的元素，返回原元素。
int indexOf(Object obj);           返回指定元素第一次出现的位置。如果没有，返回-1.
int lastIndexOf(Object obj)：   返回此集合指定元素obj最后一次出现的下标。找不到返回-1.
   List<E> subList(int fromIndex,int endIndex):截取此集合中的一部分，即截取子集，从fromIndex到endIndex包前不包后
PS:此方法在堆中产生了一个内部类SubList集合对象。此集合对象引用的父集的一部分。修改子集，会影响父集

数组与集合之间的转换
1、集合转数组
Object[] toArray()
E[] toArray(E[] e);
2、数组转集合
List Arrays.asList(数组参数);
注意:数组转成的集合，不能进行增删操作，否则会出现运行时异常.可以进行替换操作，但是会数组变量有影响。
如果想要成功进行增删操作，可以将元素，存入新的集合中。

Iterator：迭代器接口
       (1)迭代器的作用使用用来遍历集合元素。是一个接口。Collection接口提供一个方法 Iterator iterator()
       (2)Collection的实现类使用内部类定义了迭代器子类。
       (3)迭代器提供了统一的方法，用于遍历集合元素。

       常用方法：
       boolean hasNext():判断集合中是否有下一个元素
       E next():               取出集合中的下一个元素
       void remove():
在使用迭代器对集合进行遍历时，不能使用集合的移除方法移除集合的元素。必须使用迭代器自己提供的移除才行。

增强for循环-foreach循环：
       for(元素类型变量名:要遍历的集合或者数组){

       }
       实现原理:使用了迭代器思想
       与经典for循环的区别：
       (1)增强for循环中无法使用下标。
       (2)经典for循环中可以使用下标。跟下标有关的逻辑，随便写。

       List的三个实现类：
       (1)ArrayList
底层是基于动态数组的数据结构。有连续的索引，从0开始。
       (2)LinkedList
               底层是基于双链表的数据结构。每个节点上都有前后两个元素的引用。

       优缺点: 在执行get()/set()时，ArrayList的效率高，LinkedList需要移动指针，效率低
                   在增加/删除操作时，LinkedList效率高，ArrayList效率低(需要扩容，移动元素)。
ps:当然，在元素的数量大的情况下，区别才明显。

       (3)Vector:是一个比较古老的集合类型，线程安全，但是效率特别低。虽然安全，也不建议使用。

       List排序
   Comparable接口:
   如何定义集合中元素之间的大小之分？
   我们需要在定义元素类型时实现Comparable接口，实现接口内的compareTo(Ee)。实现此接口的类型的对象之间可以进行比较。

方法：
int compareTo(E e):
比较规则:
(1)this与e比较，this-e，
如果大于0，返回大于0的一个数
如果等于0, 返回0
如果小于0, 返回小于0的一个数
按照升序排序
(2)e-this,降序排序
工具类:Collections
提供了一个sort(Collection c)方法，对集合里的元素进行排序

Comparator比较器接口:
如果元素类型已经实现了comparable接口，定义了默认的比较规则。之后，再想换其他比较规则时，不修改源码。可以利用比较器接口来重新定义比较规则

方法：
int compare(E o1,E o2);
比较规则：
升序: o1-o2
降序: o2-o1

   二、   接口Queue
       Queue也是Collection的子接口，是一种数据结构，队列。
队列:通常都是一端进(offer)，另一端出(poll)。

进出原则：FIFO

因为队列要经常进行增删操作，所以使用Linkedlist实现了Queue接口.

常用方法：
       boolean offer(E e)：元素从队尾进入队列。
       E poll()：                   从队首移除元素，返回被移除的元素。当队列没有元素时返回null.
       E peek():                    查看队首元素，不移除。队列中没有元素时，返回null.

注意: 为了避免移除队列的队首时出现null,我们最好先查看队首是不是null.

Deque:是一个Queue的子接口，实现的是双端队列的数据结构。
                   双端队列：两端都可以进，也都可以出。

boolean offerFirst(E e);
boolean offerLast(E e);
E pollFirst();
E pollLast();
E peekFirst();
E peekLast();

栈的数据结构：先进后出:FILO
我们可以将双端队列的一端进行禁止操作。另一端进或出，即Stack

void push(E e)：将元素 e推进栈中
E pop():           将栈中的最顶端的元素，移除。

三、 Set接口：
特点1: 无序,存储的元素与添加顺序无关
特点2: 不可重复(使用元素的equals方法来判定是否重复)
特点3: 能存储null元素，只能存储一次。
   Hash算法机制
   Set集合设计的初衷是无序不能重复，因此向集合添加（或检索元素）时我们需要调用equals方法来一一校验。
   但是当集合中的元素过多时，我们校验的次数明显很多，因此效率就很低

   那么，如何提高效率呢？
我们为元素对象，提供了一个hash算法，用于返回此元素的一个哈希值（int值）。
并且在集合所占的内存中开辟很多小的区域，每个区域用于存储一定范围哈希值的元素。
在我们添加元素或检索元素时，先获取此元素的哈希值，然后去相应区域中查找遍历（大大降低了比较次数）
--在这个区域，哈希值对应的位置上没有元素，就将此元素存储到这个位置
--如果有，然后查看两个对象的equals的返回值
--如果为true, 不能添加
--如果为false, 可以添加，添加至对应的链表结构中(尽可能的避免发生)

HashCode方法：
       Object是引用类型的父类，提供了hashCode()方法以及equals()方法
因此我们在定义类型时，一般都重写hashCode和equals方法。
重写的重要性:
       equals方法我们用来判断集合中的元素是否重复
       hashCode方法我们在使用Set集合时，必须要重写，因为我们采用的hash算法计算Set集合元素的存储位置。

int hashCode():
Object提供的方法是通过地址计算hash值，不可控。我们需要在自定义类中重写此方法。

   重写HashCode方法：
           重写规则：尽可能的让所有的成员变量都参与运算，
尽可能的避免出现hash值碰撞
   注意:
       重写的必要性:
       (1)如果重写了equals(), 有必要重写hashCode方法
       (2)如果equals()返回true, hashCode返回值有必要相同
       (3)如果equals()返回false,hashCode返回值不一定相同，
如果返回值不同，可以提高检索的效率

反过来说:
(1)hashCode值相同，equals方法可能不同
(2)hashCode值不同，equals方法一定不同

Set接口派生的子类
HashSet：底层使用hash算法计算存储位置，无序，不重复，增加删除时效率高
LinkedHashSet: 底层使用hash算法计算存储位置，但是通过链表来维持顺序。顺序与添加顺序一致。在查看检索时，效率比较高
TreeSet：是SortedSet子接口的实现类，使用二叉树的数据结构维护元素的顺序，顺序与自然排序有关系。支持定制排序

Set集合的遍历
    因为Set集合是无序的，无下标可言，因此不能使用经典for循环。我们可以使用迭代器原理。

    (1) 调用集合的iterator()获取迭代器
    (2) 使用foreach循环

Set集合的元素：
不能轻易修改参与hash值算法的成员变量。否则容易引起内存溢出。
原因:成员变量修改后，会出现新的hash值，但是存储位置还在原hash值的位置上。因此操作时，找不到具体的存储位置。

Map接口：集合框架中的另一个父接口
Map集合，用于储存一一对应的元素数据，第一个对象可以作为索引，第二个对象作为值，我们称之为key-value，键值对。

储存数据的特点：
(1)以key-value形式进行存储。
(2)key与value都必须是引用类型
(3)key可以为null。
(4)key与value是单向一对一映射。
(5)key不能重复
存储机制：
Map是基于数组和链表的数据结构进行存储数据。
作为key的对象采用了hash算法计算存储的数组
(散列数组,散列桶)的位置.如果计算出来的位置，
数组中此位置没有元素，就可以添加到
散列桶内，如果有元素，key的equals方法
返回值为false,就会存储在散列桶元素对应的单向链表中。
如果key的equals方法返回true,就进行替换(覆盖)。
PS:使用Map集合，做为key的数据类型应该重写equals和
HashCode方法
常用方法：
V put(K k,V v):
作用：用于存储一对key-value. 返回被替换的value值
如果不是替换就返回null
V get(K k):
作用:通过key对象，获取对应的value对象，如果集合中
没有此key,返回null
Map集合的遍历
Set<K> keySet();
用于获取Map中所有的key对象，返回一个Set集合
Set<Entry<K,V>> entrySet();
将key-value封装成内部类对象，返回Entry对象的Set集合
Collection<V> values();
将map集合中的所有value封装到一个Collection集合中。
装载因子和HashMap的优化
装载因子:DEFAULT_LOAD_FACTOR = 0.75f
默认容量:DEFAULT_INITIAL_CAPACITY
16,就是数组的容量
元素个数: size

当我们创建一个HashMap对象时，底层数组的初始容量为16。当存储的数据的
个数 size/DEFAULT_INITIAL_CAPACITY等于DEFAULT_LOAD_FACTOR时，
数组开始扩容。此时最佳。

如果小于0.75扩容，比较占内存。
如果大于0.75扩容，操作的元素比较多。

Map接口的子类:

HashMap与HashTable的区别
(1)HashTable是一个古老的类。不建议使用
(2)HashTable是一个线程安全的类，HashMap线程不安全
(3)HashTable的key不能是null,HashMap可以是null
LinkedHashMap:是HashMap子类，使用链表来维护key-value的顺序，在迭代时顺序与添加顺序一致。
TreeMap：是SortedMap子接口的实现类，使用了二叉树的数据结构维护填入集合的顺序。
(1)自然排序：
往TreeMap里添加的key对象，可以实现Comparable接口。重写compareTo方法
(2)定制排序：做为key对象的数据类型，可以不实现Comparabel接口。
需要创建一个比较器Comparator对象。实现compare方法
Properties:
是HashTable的子类型，用于封装属性文件的key-value信息因为在文件里写的都是字符串，因此Properties的key与value都是字符串类型