Java面试题(二)

最新推荐文章于 2023-04-11 11:18:31 发布

吃小孩的果冻

最新推荐文章于 2023-04-11 11:18:31 发布

阅读量92

点赞数

分类专栏：面试题文章标签： java 数据结构链表

本文链接：https://blog.csdn.net/yibushao/article/details/111544136

版权

面试题专栏收录该内容

2 篇文章 0 订阅

订阅专栏

Java面试题(集合专题)

一、 Java集合体系有什么?

集合类存放于 Java.util 包中，主要有 3 种：set(集）、list(列表包含 Queue）和 map(映射)。

Collection：Collection 是集合 List、Set、Queue 的最基本的接口。
Iterator：迭代器，可以通过迭代器遍历集合中的数据。
Map：是映射表的基础接口。

1. Iterator接口
Iterator接口是一个用于遍历集合中元素的接口，主要包含hashNext(),next(),remove()三种方法。如果实现Iterator接口，那么在遍历集合中元素的时候，只能往后遍历，被遍历后的元素不会在遍历到，通常无序集合实现的都是这个接口，比如HashSet，HashMap
2. LinkedIterator接口：
LinkedIterator在Iterator的基础上又添加了add(),previous(),hasPrevious()三种方法，那些元素有序的集合，实现的一般都是LinkedIterator接口，实现这个接口的集合可以双向遍历，既可以通过next()访问下一个元素，又可以通过previous()访问前一个元素，比如ArrayList。
3. Collection （集合的最大接口）继承关系
 List 可以存放重复的内容
 Set 不能存放重复的内容，所以的重复内容靠hashCode()和equals()两个方法区分
 Queue 队列接口
 SortedSet可以对集合中的数据进行排序
Collection定义了集合框架的共性功能：
在这里插入图片描述
add方法的参数类型是Object。以便于接收任意类型对象。
集合中存储的都是对象的引用(地址)。

4. List
凡是可以操作角标的方法都是该体系特有的方法：
在这里插入图片描述

ArrayList 线程不安全，查询速度快
Vector 线程安全，但速度慢，已被ArrayList替代
LinkedList 链表结果，增删速度快
TreeList 树型结构，保证增删复杂度都是O（log n）,增删性能远高于ArrayList和 LinkedList,但是稍微占用内存

5. Set

Set：元素是无序(存入和取出的顺序不一定一致)，元素不可以重复。
- HashSet:底层数据结构是哈希表, 是线程不安全的, 数据不同步。
- HashSet是如何保证元素唯一性的呢？
  是通过元素的两个方法，hashCode和equals来完成。
  如果元素的HashCode值相同，才会判断equals是否为true。
  如果元素的hashcode值不同，不会调用equals。
  注意,对于判断元素是否存在，以及删除等操作，依赖的方法是元素的 hashcode和equals方法。
TreeSet：底层数据结构是二叉树，存放有序：TreeSet线程不安全可以对Set集合中的元素进行排序。通过compareTo或者compare方法来保证元素的唯一性。

6. Map
Correction、Set、List接口都属于单值的操作，而Map中的每个元素都使用key——>value的形式存储在集合中。
Map集合：该集合存储键值对, 是key:value一对一对往里存, 而且要保证键的唯一性。
在这里插入图片描述
Map接口的常用子类

HashMap：底层数据结构是哈希表，允许使用 null 值和 null 键，该集合是数据不同步的，将hashtable替代，jdk1.2.效率高。
TreeMap：底层数据结构是二叉树，线程不同步，可以用于给map集合中的键进行排序。

二、 List 的三个子类的特点

ArrayList 底层结构是数组,底层查询快,增删慢
LinkedList 底层结构是链表型的,增删快,查询慢
Voctor 底层结构是数组线程安全的,增删慢,查询慢

三、 List 和 Map、Set 的区别

结构特点:
List 和 Set 是存储单列数据的集合，Map 是存储键和值这样的双列数据的集合；

List 中存储的数据是有顺序，并且允许重复；

Map 中存储的数据是没有顺序的，其键是不能重复的，它的值是可以有重复的，Set中存储的数据是无序的，且不允许有重复，但元素在集合中的位置由元素的 hashcode 决定，位置是固定的（Set 集合根据 hashcode 来进行数据的存储，所以位置是固定的，但是位置不是用户可以控制的，所以对于用户来说 set 中的元素还是无序的）；
实现类
List 接口有三个实现类（LinkedList：基于链表实现，链表内存是散乱的，每一个元素存储本身内存地址的同时还存储下一个元素的地址。链表增删快，查找慢；ArrayList：基于数组实现，非线程安全的，效率高，便于索引，但不便于插入删除；Vector：基于数组实现，线程安全的，效率低）。

Map 接口有三个实现类（HashMap：基于 hash 表的 Map 接口实现，非线程安全，高效，支持 null 值和 null键；HashTable：线程安全，低效，不支持 null 值和 null 键；LinkedHashMap：是 HashMap 的一个子类，保存了记录的插入顺序；SortMap 接口：TreeMap，能够把它保存的记录根据键排序，默认是键值的升序排序）。

Set 接口有两个实现类（HashSet：底层是由 HashMap 实现，不允许集合中有重复的值，使用该方式时需要重写 equals()和 hashCode()方法；LinkedHashSet：继承与 HashSet，同时又基于 LinkedHashMap 来进行实现，底层使用的是 LinkedHashMp）。

四、HashMap底层实现原理

HashMap根据键的hashCode值存储数据,大多数情况下可以直接定位到它的值.因而具有很快的访问速度,但是遍历顺序却不确定的.HashMap最多只允许一条记录的键为null,允许多条记录的值为null。
HashMap非线程安全,即任一时刻可以有多个线程同时写HashMap,可能会导致数据的不一致。
如果需要满足线程安全,可以用Collections的synchronizedMap方法使HashMap具有线程安全的能力,或者使用ConcurrentHashMap,HashTable.如下详细介绍。

JDK1.8之前 (数组+链表)
- 最开始存入数据的时候
1. JDK1.8之前HashMap底层是数组和链表结合在一起使用,也就是链表散列.数组的长度规定是2的幂.数组中存放的对象是Entry<key,value>对象 ,不允许有重复的key存在,为什么呢?
2. 首先,先判断key存放的位置, HashMap通过key的hashCode经过扰动函数处理过后得到hash值,然后通过(n-1)&hash判断当前元素存放的位置(这里的n指的是数组的长度). 也可以理解:key%数组长度=对应数组的索引下标.然后将value存入到entry对象中。
  所谓扰动函数知道就是HashMap的hash方法.使用hash方法也就是扰动函数是为了防止一些实现比较差的hashCode()方法,换句话说使用扰动函数之后可以减少碰撞。
3. 为什么使用(n-1)&length长度呢?
  (1)保证数组不会越界:
  首先我们要知道,在HashMap和ConcurrentHashMap中,数组的长度按规定一定是2的幂(2的n次方)因此,数组的长度的二进制形式是:10000…000,1后面有一堆0。那么tab.length - 1 的二进制形式就是01111…111，0后面有一堆1。最高位是0, 和hash值相"与"，结果值一定不会比数组的长度值大,因此也就不会发生数组越界.
  (2)保证元素尽可能的均匀分布
  在操作的时候,链表中的元素越多,效率越低,因为要不停的对链表循环比较.所以,一定要使哈希均匀分布,尽量减少哈希冲突,提高效率。
- 继续存入数据
  继续存入数据,还是要通过第1步计算key在数组中的索引位置. 如果当前位置存在元素的话,再通过key的equal()方法判断key是否相同,如果相同value值就会覆盖; 如果key的equals()方法不同,则在数组对应索引位置变为链表存储新的Entry<key,value>。
  - 拉链法
    上一步说到的链表是拉链法: 将链表和数组相结合.也就是说创建一个链表数组,数组中每一格就是一个链表.若约到哈希冲突,则将冲突的值加到链表中即可.
JDK1.8之后(数组+链表+红黑树)
如果链表的长度超过8则转为红黑树, 当红黑树中的元素小于6时又变为链表(有这些变化的原因就是综合时间复杂度以及空间复杂度的考虑)获取时,直接找到key的hash值对应的下标,在进一步用equels方法判断key是否相同,从而找到对应值则返回找不到则返回null。
相比于之前的版本,jdk1.8在解决哈希冲突时有了较大的变化,当链表长度大于阀值(默认为8)时,将链表转化为红黑树,以减少搜索时间。

五、谈一下 hashMap 中什么时候需要进行扩容，扩容 resize()又是如何实现的？

调用场景：

初始化数组 table
当数组 table 的 size 达到阙值时进行扩容

实现过程：
通过判断旧数组的容量是否大于0来判断数组是否初始化过。

如果小于0：进行初始化,判断是否调用无参构造器。
如果调用了无参构造器: 使用默认的大小和阙值<阈值 12. 阀值=默认大小为16乘以负载因子0.75。
如果没有调用无参构造器: 使用构造函数中初始化的容量, 当然这个容量是经过tableSizefor 计算后的 2 的次幂数) 。
如果大于0: 进行扩容，扩容成两倍(小于最大值的情况下)，之后在进行将元素重新进行与运算复制到新的散列表中。

概括的讲：
扩容需要重新分配一个新数组，新数组是老数组的2倍长，然后遍历整个老结构，把所有的元素挨个重新hash分配到新结构中去。PS：可见底层数据结构用到了数组，到最后会因为容量问题都需要进行扩容操作。

六、ConcurrentHashMap特点

Segment 段
ConcurrentHashMap 和 HashMap 思路是差不多的，但是因为它支持并发操作，所以要复杂一些。整个 ConcurrentHashMap 由一个个 Segment 组成，Segment 代表”部分”或”一段“的意思，所以很多地方都会将其描述为分段锁。注意，行文中，我很多地方用了“槽”来代表一个segment。
线程安全（Segment 继承 ReentrantLock 加锁）
简单理解就是，ConcurrentHashMap 是一个 Segment 数组，Segment 通过继承ReentrantLock 来进行加锁，所以每次需要加锁的操作锁住的是一个 segment，这样只要保证每个Segment 是线程安全的，也就实现了全局的线程安全。
在这里插入图片描述

并行度（默认 16）
concurrencyLevel：并行级别、并发数、Segment 数，怎么翻译不重要，理解它。默认是 16，也就是说 ConcurrentHashMap 有 16 个 Segments，所以理论上，这个时候，最多可以同时支持 16 个线程并发写，只要它们的操作分别分布在不同的 Segment 上。这个值可以在初始化的时候设置为其他值，但是一旦初始化以后，它是不可以扩容的。再具体到每个 Segment 内部，其实每个 Segment 很像之前介绍的 HashMap，不过它要保证线程安全，所以处理起来要麻烦些。
Java8 实现（引入了红黑树）
Java8 对 ConcurrentHashMap 进行了比较大的改动,Java8 也引入了红黑树
在这里插入图片描述

七、HashTable

Hashtable 是遗留类，很多映射的常用功能与 HashMap 类似，不同的是它承自 Dictionary 类，并且是线程安全的，任一时间只有一个线程能写 Hashtable，并发性不如 ConcurrentHashMap，因为 ConcurrentHashMap 引入了分段锁。Hashtable 不建议在新代码中使用，不需要线程安全的场合可以用 HashMap 替换，需要线程安全的场合可以用 ConcurrentHashMap 替换。

八、HashMap 和 HashTable 有什么区别?

HashMap 是线程不安全的,是 Map 的一个实现类,是将键映射到值得对象,不允许键值重复,允许空键和空值;由于非线程安全,HashMap 的效率要较 HashTable 的效率高一些.
HashTable 是线程安全的一个集合,不允许 null 值作为一个 key 值或者 Value 值;
HashTable 是 sychronize,多个线程访问时不需要自己为它的方法实现同步,而 HashMap 在被多个线程访问的时候需要自己为它的方法实现同步;

九、HashMap，HashTable，ConcurrentHashMap之间的区别，及性能对比

性能：ConcurrentHashMap(线程安全) > HashMap > HashTable(线程安全)
区别对比一(HashMap和HashTable区别)：
1、HashMap是非线程安全的，HashTable是线程安全的。
2、HashMap的键和值都允许有null值存在，而HashTable则不行。
3、因为线程安全的问题，HashMap效率比HashTable的要高。
4、Hashtable是同步的，而HashMap不是。因此，HashMap更适合于单线程环境，而Hashtable适合于多线程环境。一般现在不建议用HashTable, ①是HashTable是遗留类，内部实现很多没优化和冗余。②即使在多线程环境下，现在也有同步的ConcurrentHashMap替代，没有必要因为是多线程而用HashTable。
区别对比二(HashTable和ConcurrentHashMap区别)：
HashTable使用的是Synchronized关键字修饰，ConcurrentHashMap是使用了锁分段技术来保证线程安全的。
Hashtable中采用的锁机制是一次锁住整个hash表，从而在同一时刻只能由一个线程对其进行操作；而ConcurrentHashMap中则是一次锁住一个桶。
ConcurrentHashMap默认将hash表分为16个桶，诸如get、put、remove等常用操作只锁住当前需要用到的桶。这样，原来只能一个线程进入，现在却能同时有16个写线程执行，并发性能的提升是显而易见的。