常见集合篇

最新推荐文章于 2024-07-16 18:35:54 发布

丿Mars灬龙族-

最新推荐文章于 2024-07-16 18:35:54 发布

阅读量109

点赞数 1

分类专栏：面试文章标签：算法开发语言 java

本文链接：https://blog.csdn.net/m0_56307146/article/details/132391105

版权

面试专栏收录该内容

9 篇文章 1 订阅

订阅专栏

常见集合篇

算法复杂度分析

面试官： 什么是算法时间复杂度？

候选人：

时间复杂度表示了算法的执行时间与数据规模之间的增长关系。

面试官： 常见的时间复杂度有哪些？

候选人：

O(1)、O(n)、O(n^2)、O(logn)（常对幂指阶）

面试官： 什么是算法的空间复杂度？

候选人：

表示算法占用的额外存储空间与数据规模之间的增长关系
常见的空间复杂度有O(1)、O(n)、O(n^2)。

常见的Java集合类

面试官： 说一说Java提供的常见集合？

候选人：

嗯~~，好的。

在Java中提供了两大类的集合框架，主要分为两类：

第一个是Collection 属于单列集合，第二个是Map 属于双列集合

在Collection中有两个子接口List和Set。在我们平常开发过程中用的比较多像list接口中的实现类ArrayList和LinkedList。在Set接口中有实现类HashSet和TreeSet。
在map接口中有很多的实现类，平时比较常见的是HashMap、TreeMap，还有一个线程安全的map:ConcurrentHashMap

ArrayList

数据结构-数组

面试官： 为什么数组索引从0开始呢？假如从1开始不行吗？

候选人：

在根据数组索引获取元素的时候，会用索引和寻址公式来计算内存所对应的元素数据，寻址公式是：数组的首地址 + 索引乘以存储数据的类型大小
如果数组的索引从1开始，寻址公式中，就需要增加一次减法操作，对于CPU来说就多了一次指令，性能不高

面试官： 查找、删除和插入的时间复杂度？

候选人：

随机（通过下标）查询的时间复杂度是O(1)
查找元素（未知下标）的时间复杂度是O(n)
查找元素（未知下标但排序）通过二分查找的时间复杂度是O(logn)

插入和删除的时候，为了保证数组的内存连续性，需要挪动数组元素，平均时间复杂度为O(N)

底层原理及构造函数

面试官： ArrayList底层是如何实现的？

候选人：

嗯~，我阅读过arraylist的源码，我主要说一下add方法吧

第一：确保数组已使用长度（size）加1之后足够存下下一个数据

第二：计算数组的容量，如果当前数组已使用长度+1后的大于当前的数组长度，则调用grow方法扩容（原来的1.5倍）

第三：确保新增的数据有地方存储之后，则将新元素添加到位于size的位置上。

第四：返回添加成功布尔值。

面试官： ArrayList list=new ArrayList(10)中的list扩容几次

候选人：

是new了一个ArrayList并且给了一个构造参数10，对吧？(问题一定要问清楚再答)

面试官： 是的

候选人：

好的，在ArrayList的源码中提供了一个带参数的构造方法，这个参数就是指定的集合初始长度，这里面并没有扩容。

如何实现数组与List之间的转换

面试官： 用Arrays.asList转List后，如果修改了数组内容，list受影响吗？List用toArray转数组后，如果修改了List内容，数组受影响吗

候选人：

Arrays.asList转List之后，如果修改了数组的内容，list会受影响，因为它的底层使用的Arrays类中的一个内部类ArrayList来构造的集合，在这个集合的构造器中，把我们传入的这个集合进行了包装而已，族中指向的都是同一个内存地址

list用了toArray转数组后，如果修改了list内容，数组不会受影响，当带调用了toArray以后，在底层它是进行了数组的拷贝，跟原来的元素没啥关系了，所有即使list修改了以后，数组也不受影响

LinkedList

数据结构-链表

面试官： 单向链表和双向链表的区别是什么？

候选人：

单向链表只有一个方向，结点只有一个后继指针 next。
双向链表支持两个方向，每个结点不止有一个后继指针next指向后面的结点，还有一个前驱指针prev指向前面的结点

面试官： 链表操作数据的时间复杂度是多少？

候选人：

单向链表：头O(1)，其他O(n)
双向链表：头尾(1)，其他O(n)，给定节点头O(1)

ArrayList 和 LinkedList 的区别

面试官： ArrayList 和 LinkedList 的区别是什么？

候选人：

嗯，它们两个主要是底层使用的数据结构不一样，ArrayList 是动态数组，LinkedList 是双向链表，这也导致了它们很多不同的特点。

1、从操作效率来说

ArrayList按照下标查询的时间复杂度O(1)【内存是连续的，根据寻址公式】，LinkedList不支持下标查询

查找（未知索引）：ArrayList需要遍历，链表也需要遍历，时间复杂度都是O(n)

新增和删除

ArrayList尾部插入和删除，时间复杂度是O(1)；其他部分增删需要挪动数组，时间复杂度是O(n)
LinkedList头尾节点增删时间复杂度是O(1)，其他都需要遍历，时间复杂度是O(n)

2、从内存空间占用来说

ArrayList底层是数组，内存连续，节省内存

LinkedList是双向链表需要存储数据和两个指针，更占用内存

3、从该线程安全来说，ArrayList和LinkedList都不是线程安全的

面试官： 嗯，好的，刚才你说了ArrayList和LinkedList都不是线程安全的，你们在项目中是如何解决这个线程安全问题的？

候选人：

嗯，是这样的，主要有两种解决方案：

第一：我们使用这个集合，优先在方法内使用，定义为局部变量，这样的话，就不会出现线程安全问题。

第二：如果非要在成员变量中使用的话，可以使用线程安全的集合来替代

ArrayList可以通过Collections 的 synchronizedList 方法将 ArrayList 转换成线程安全的容器后再使用。

LinkedList 转换成ConcurrentLinkedQueue来使用

数据结构

二叉树

面试官： 什么是二叉树？

候选人：

每个节点做多有两个“叉”，分别是左子节点和右子节点。
不要求每个节点都要两个子节点，有的节点只有左子节点，有的节点只有右子节点。
二叉树每个节点的左子树和右子树也分别满足二叉树的定义

面试官： 什么是二叉搜索树？

候选人：

二叉搜索树又名二叉查找树，有序二叉树
在树的任意一个节点，其左子树中的每个节点的值，都要小于这个节点的值，而右子树节点的值都大于这个节点的值
没有键值相等的节点
通常情况下二叉搜索树的时间复杂度为O(logn)

红黑树

面试官： 什么是红黑树？

候选人：

红黑树也是一种自平衡的二叉搜索树(BST)
所有的红黑规则都是希望红黑树能够保证平衡
红黑树的时间复杂度：查找、添加、删除都是O(logn)

散列表

面试官： 什么是散列表？

候选人：

散列表(Hash Table)又名哈希表/Hash表
根据键（Key）直接访问在内存存储位置值（Value）的数据结构
由数组演化而来的，利用了数组支持按照下标进行随机访问数据

面试官： 什么是散列冲突？

候选人：

散列冲突又称哈希冲突，哈希碰撞
值多个key映射到同一个数组下标位置

面试官： 怎么解决散列冲突？

候选人：

数组的每个下标位置称之为桶（bucket）或者槽（slot）
每个桶(槽)会对应一条链表
hash冲突后的元素都放到相同槽位对应的链表或红黑树中

## HashMap ### HashMap的实现原理 **面试官：** 说一下HashMap的实现原理？

候选人：

嗯。它分为了以下几个部分：

1、底层使用hash表数据结构，即数组 + （链表|红黑树）

2、添加数据时，计算key的值确定元素在数组中的下标
key相同则替换，不同则存入链表或红黑树中

3、获取数据通过key的hash计算数据下标获取元素

面试官： HashMap的jdk1.7和jdk1.8有什么区别？

候选人：

JDK1.8之前采用的拉链法，数组 + 链表
JDK1.8之后采用数组 + 链表 + 红黑树，链表长度大于8且数组长度大于64则会从链表转化为红黑树

HashMap

HashMap的put方法的具体流程

面试官： 好的，你能说下HashMap的put方法的具体流程吗？

候选人：

嗯，好的。

判断键值对数组table是否为空或为null，否则执行resize()进行扩容（初始化）
根据键值key计算hash值获得数组索引
判断table[i]==null，条件成立，直接新建节点添加
如果table[i]==null，不成立
4.1 判断table[i]的首个元素是否和key一样，如果相同直接覆盖value
4.2 判断table[i] 是否为treeNode，即table[i] 是否为红黑树，如果是红黑树，则直接在树中插入键值对
4.3 遍历table[i]，链表的尾部插入数据，然后判断链表长度是否大于8、数组长度是否大于64，如果满足就把链表转换为红黑树，在红黑树中执行插入操作，遍历过程中若发现key已经存在直接覆盖value
插入成功后，判断实际存在的键值对数量size是否超出了最大容量threshold（数组长度*0.75），如果超过，进行扩容。

HashMap的扩容机制

面试官： 好的，你刚才多次介绍了hashmap的扩容，能讲一讲HashMap的扩容机制吗？

候选人：

好的

在添加元素或初始化的时候需要调用resize方法进行扩容，第一次添加数据初始化数组长度为16，以后每次扩容都是达到了扩容阈值（数组长度 * 0.75）
每次扩容的时候，都是扩容之前容量的2倍
扩容之后，会新创建一个数组，需要把老数组中的数据挪到新的数组中
没有hash冲突的节点，则直接使用 e.hash & (newCap - 1) 计算新数组的索引位置
如果是红黑树，走红黑树的添加
如果是链表，则需要遍历链表，可能需要拆分链表，判断(e.hash & oldCap)是否为0，该元素的位置要么停留在原始位置，要么移动到原始位置 + 增加的数组大小这个位置上

HashMap的寻址算法和数组长度

面试官： 好的，刚才你说的通过hash计算后找到数组的下标，是如何找到的呢，你了解hashMap的寻址算法吗？

候选人：

这个哈希方法首先计算出key的hashCode值，然后再通过这个hash值右移16位后的二进制进行按位异或运算得到最后的hash值。

在putValue的方法中，计算数组下标的时候使用hash值与数组长度取模得到存储数据下标的位置，hashmap为了性能更好，并没有直接采用取模的方式，而是使用了数组长度-11得到一个值，用这个值按位与运算hash值，最终得到数组的位置。

面试官： 为何HashMap的数组长度一定是2的次幂？

候选人：

嗯，好的。hashmap这么设计主要有两个原因：

第一：

计算索引时效率更高，如果是 2 的 n 次幂可以使用位与运算代替取模

第二：

扩容时重新计算索引效率更高：在进行扩容时会进行判断 hash值按位与运算旧数组长度是否 == 0，如果等于0，则把元素留在原来位置，否则新位置是等于旧位置的下标 + 旧数组长度

hashmap在1.7情况下的多线程死循环问题

面试官： 好的，我看你对hashmap了解的挺深入的，你知道hashmap在1.7情况下的多线程死循环问题吗？

候选人：

嗯，知道的。是这样

jdk7的数据结构是：数组 + 链表

在数组进行扩容的时候，因为链表是头插法，在进行数据迁移的过程中，有可能导致死循环

比如说，现在有两个线程

线程一：读取到当前的hashmap数据，数据中一个链表，在准备扩容时，线程二介入

线程二也读取hashmap，直接进行扩容。因为是头插法，链表的顺序会进行颠倒过来。比如原来的顺序是AB，扩容后的顺序是BA，线程二执行结束。

当线程一再继续执行的时候就会出现死循环的问题。

线程一先将A移入新的链表，再将B插入到链头，由于另一个线程的问题，B的next指向了A，所以B->A->B，形成循环。

当然，JDK 8 将扩容算法做了调整，不再将元素加入链表头（而是保持与扩容前一样的顺序），尾插法，就避免了jdk7中死循环的问题。

面试官： 好的，hashmap是线程安全的吗？

**候选人：**不是线程安全的

面试官： 那我们想要使用线程安全的map该怎么做呢？

**候选人：**我们可以采用ConcurrentHashMap进行使用，它是一个线程安全的HashMap

面试官： 那你能聊一下ConcurrentHashMap的原理吗？

候选人： 好的，请参考《多线程相关面试题》中的ConcurrentHashMap部分的讲解

HashSet与HashMap的区别

面试官： HashSet与HashMap的区别？

候选人： 嗯，是这样。

HashSet底层其实是用HashMap实现存储的，HashSet封装了一系列HashMap的方法，依靠HashMap来存储元素值，（利用hashMap的key键进行存储），而value值默认为Object对象。所以HashSet也不允许出现重复值，判断标准和HashMap判断标准相同，两个元素的hashCode相等并且通过equals()方法返回true。