面试准备系列——Java基础技术篇（9）/Java集合（2）高频问题收集

最新推荐文章于 2023-04-23 19:36:01 发布

ICoder_Next

最新推荐文章于 2023-04-23 19:36:01 发布

阅读量198

点赞数

分类专栏：面试题收集文章标签：面试 java

本文链接：https://blog.csdn.net/qq_36079912/article/details/107428925

版权

面试题收集专栏收录该内容

21 篇文章 4 订阅

订阅专栏

文章目录

1.Map，List和Set都是Collection的子接口吗？
2.说说Java中常见的集合
（重点）3.HashMap和Hashtable的区别有哪些？
4.TreeMap有哪些特性？
5.ArrayList和LinkedList有哪些区别？
- ArrayList扩容机制
6.HashSet和TreeSet有哪些区别？
7.LinkedHashMap和LinkedHashSet有了解吗？
8.List和Set的区别？
9.Iterator和ListIterator的区别是什么？
10.几个需要熟记的集合类图

1.Map，List和Set都是Collection的子接口吗？

Map是和Collection并列的集合上层接口，没有继承关系；List和Set是Collection的子接口。

2.说说Java中常见的集合

Java中的常见集合可以概括如下。

Map接口和Collection接口是所有集合框架的父接口
Collection接口的子接口包括：Set接口和List接口
Map接口的实现类主要有：HashMap、TreeMap、Hashtable、LinkedHashMap、ConcurrentHashMap以及Properties等
Set接口的实现类主要有：HashSet、TreeSet、LinkedHashSet等
List接口的实现类主要有：ArrayList、LinkedList、Stack以及Vector等

在这里插入图片描述

（重点）3.HashMap和Hashtable的区别有哪些？

HashMap和Hashtable之间的区别可以总结如下。

HashMap没有考虑同步，是线程不安全的；Hashtable使用了synchronized关键字，是线程安全的；
HashMap允许null作为Key；Hashtable不允许null作为Key，Hashtable的value也不可以为null
HashMap 把HashTable的contains 方法去掉了，改成containsValue和containsKey，因为contains方法容易让人引起误解。HashTable 继承自Dictionary 类，而HashMap是Java 1.2引进的Map interface的一个实现。

解析：
这个算是面试官针对HashMap的一个开胃小菜，重点是根据候选人的回答进行下一步的考察。既然候选人说出了线程安全和不安全的区别，面试官会接着考察线程安全的具体含义，如下所示：

HashMap是线程不安全的是吧？你可以举一个例子吗？

（注意，以下是候选人常见的错误理解！！！，因为上边的答案是大家背出来的）
有一个快速失败fast-fail机制，当对HashMap遍历的时候，调用了remove方法使其迭代器发生改变的时候会抛出一个异常ConcurrentModificationException。Hashtable因为在方法上做了synchronized处理，所以不会抛出异常。（自信的语气^_感觉面试官很low）。

我们这里先给出正确答案：

HashMap线程不安全主要是考虑到了多线程环境下进行扩容可能会出现HashMap死循环
Hashtable线程安全是由于其内部实现在put和remove等方法上使用synchronized进行了同步，所以对单个方法的使用是线程安全的。但是对多个方法进行复合操作时，线程安全性无法保证。比如一个线程在进行get操作，一个线程在进行remove操作，往往会导致下标越界等异常。

需要注意的是：HashMap不扩容的话，是不会存在线程安全问题的！

既然说到了这里，那么我们来看看大家一直想说的Java集合快速失败（fast-fail）机制是怎么回事儿吧：

Java集合中的快速失败（fast-fail）机制：
答：快速失败是Java集合的一种错误检测机制，当多个线程对集合进行结构上的改变的操作时，有可能会产生fast-fail。

例如：

假设存在两个线程（线程1、线程2），线程1通过Iterator在遍历集合A中的元素，在某个时候线程2 修改了集合A的结构（是结构上面的修改，而不是简单的修改集合元素的内容），那么这个时候程序就可能会抛出 ConcurrentModificationException异常，从而产生fast-fail快速失败。

那么快速失败机制底层是怎么实现的呢？

迭代器在遍历时直接访问集合中的内容，并且在遍历过程中使用一个 modCount 变量。集合在被遍历期间如果内容发生变化，就会改变modCount的值。当迭代器使用hashNext()/next()遍历下一个元素之前，都会检测modCount变量是否为expectedModCount值，是的话就返回遍历；否则抛出异常，终止遍历。JDK源码中的判断大概是这样的：
在这里插入图片描述

我们再来接着看异常ConcurrentModificationException，JDK中是这么介绍该异常的：
在这里插入图片描述
我来解释下JDK中的英文，大概意思就是说当检测到一个并发的修改，就可能会抛出该异常，一些迭代器的实现会抛出该异常，以便可以快速失败。但是你不可以为了便捷而依赖该异常，而应该仅仅作为一个程序的侦测。

前面常见的错误答案，错误的认为快速机制就是HashMap线程不安全的表现。并且坚定的认为Hashtable和Vector等线程安全的集合不会存在并发修改时候的快速失败，这是大错特错。概念和原理理解的不清晰导致掉入了面试官的陷阱里了，大家可以打开JDK源码，会发现Hashtable也会在迭代的时候抛出该异常，可能发生快速失败。

HashMap底层实现结构有了解吗？

HashMap底层实现数据结构为数组+链表的形式，JDK8及其以后的版本中使用了数组+链表+红黑树实现，解决了链表太长导致的查询速度变慢的问题。大概结构如下图所示：
在这里插入图片描述

HashMap的初始容量，加载因子，扩容增量是多少？

HashMap的初始容量16，加载因子为0.75，扩容增量是原容量的1倍。如果HashMap的容量为16，一次扩容后容量为32。
HashMap扩容是指元素个数 （包括数组和链表+红黑树中） 超过了16*0.75=12之后开始扩容。

解析：
这个题目，好多同学表现的不够出色，出现许多记忆不准确的情况。这说明，大家对为什么初始容量是16，扩容后为什么是32的原理不太清晰。那么我们接着看下一个知识点吧，也许会对你有启发（联想记忆）

HashMap的长度为什么是2的幂次方？

我们将一个键值对插入HashMap中，通过将Key的hash值与length-1进行&运算，实现了当前Key的定位，2的幂次方可以减少冲突（碰撞）的次数，提高HashMap查询效率
如果length为2的幂次方，则length-1 转化为二进制必定是11111……的形式，在与h的二进制与操作效率会非常的快，而且空间不浪费
如果length不是2的幂次方，比如length为15，则length-1为14，对应的二进制为1110，在与h与操作，最后一位都为0，而0001，0011，0101，1001，1011，0111，1101这几个位置永远都不能存放元素了，空间浪费相当大，更糟的是这种情况中，数组可以使用的位置比数组长度小了很多，这意味着进一步增加了碰撞的几率，减慢了查询的效率！这样就会造成空间的浪费。

接下来，我们来做一个简单的总结：

总结：

也就是说2的N次幂有助于减少碰撞的几率，空间利用率比较大。这样你就明白为什么第一次扩容会从16 ->32了吧？总不会再说32+1=33或者其余答案了吧？至于加载因子，如果设置太小不利于空间利用，设置太大则会导致碰撞增多，降低了查询效率，所以设置了0.75。

上边介绍了HashMap在存储空间不足的时候会进行扩容操作。那么，我们接着来看HashMap中的存储和扩容等相关知识点吧。

HasMap的存储和获取原理

当调用put()方法传递键和值来存储时，先对键调用hashCode()方法，返回的hashCode用于找到bucket位置来储存Entry对象，也就是找到了该元素应该被存储的桶中（数组）。当两个键的hashCode值相同时，bucket位置发生了冲突，也就是发生了Hash冲突，这个时候，会在每一个bucket后边接上一个链表（JDK8及以后的版本中还会加上红黑树）来解决，将新存储的键值对放在表头（也就是bucket中）。

当调用get方法获取存储的值时，首先根据键的hashCode找到对应的bucket，然后根据equals方法来在链表和红黑树中找到对应的值。

HasMap的扩容步骤

HashMap里面默认的负载因子大小为0.75，也就是说，当Map中的元素个数**（包括数组，链表和红黑树中）超过了16*0.75=12之后开始扩容。将会创建原来HashMap大小的两倍的bucket数组**，来重新调整map的大小，并将原来的对象放入新的bucket数组中。这个过程叫作rehashing，因为它调用hash方法找到新的bucket位置。

注意：链表长度超过8的时候，会将链表转换为红黑树的。而当红黑树中的元素个数少于6的时候就会将红黑树转换成链表的。

至于，为什么个数多于8就转换成红黑树，少于6就转换成链表，除了可以答出是查询时间由O(N)->O(logN)，还可以答出是由于根据概率模型泊松分布，超过8之后，进入哈希桶的概率变小了。

但是，需要注意的是在多线程环境下，HashMap扩容可能会导致死循环。

前面我们介绍了在HashMap存储的时候，会发生Hash冲突，那么我们一起来看Hash冲突的解决办法吧。

解决Hash冲突的方法有哪些？

(上一篇文章也有详细介绍这个的)

拉链法（HashMap使用的方法）
线性探测再散列法
二次探测再散列法
伪随机探测再散列法

哪些类适合作为HashMap的键？

String和Interger这样的包装类很适合做为HashMap的键，因为他们是final类型的类，而且重写了equals和hashCode方法，避免了键值对改写，有效提高HashMap性能。

为了计算hashCode()，就要防止键值改变，如果键值在放入时和获取时返回不同的hashCode的话，那么就不能从HashMap中找到你想要的对象。

另外，**“一致性Hash算法”**是一个很好的面试加分点，可以研究：深入浅出一致性Hash原理

ConcurrentHashMap和Hashtable的区别？

ConcurrentHashMap结合了HashMap和Hashtable二者的优势。HashMap没有考虑同步，Hashtable考虑了同步的问题。但是Hashtable在每次同步执行时都要锁住整个结构。

ConcurrentHashMap锁的方式是稍微细粒度的，ConcurrentHashMap将hash表分为16个桶（默认值），诸如get，put，remove等常用操作只锁上当前需要用到的桶。

ConcurrentHashMap的具体实现方式(分段锁)：
该类包含两个静态内部类MapEntry和Segment，前者用来封装映射表的键值对，后者用来充当锁的角色。
在这里插入图片描述
Segment是一种可重入的锁ReentrantLock，每个Segment守护一个HashEntry数组里的元素，当对HashEntry数组的数据进行修改时，必须首先获得对应的Segment锁。

注意：在实际的开发中，我们在单线程环境下可以使用HashMap，多线程环境下可以使用ConcurrentHashMap，至于Hashtable已经不被推荐使用了（也就是说Hashtable只存在于面试题目中了）。

4.TreeMap有哪些特性？

TreeMap底层使用红黑树实现，TreeMap中存储的键值对按照键来排序。

如果Key存入的是字符串等类型，那么会按照字典默认顺序排序
如果传入的是自定义引用类型，比如说User，那么该对象必须实现Comparable接口，并且覆盖其compareTo方法；或者在创建TreeMap的时候，我们必须指定使用的比较器。如下所示：

// 方式一：定义该类的时候，就指定比较规则
class User implements Comparable{
    @Override
    public int compareTo(Object o) {
        // 在这里边定义其比较规则
        return 0;
    }
}
public static void main(String[] args) {
    // 方式二：创建TreeMap的时候，可以指定比较规则
    new TreeMap<User, Integer>(new Comparator<User>() {
        @Override
        public int compare(User o1, User o2) {
            // 在这里边定义其比较规则
            return 0;
        }
    });
}

关于TreeMap的考察，会涉及到两个接口Comparable和Comparator的比较。Comparable接口的后缀是able大概表示可以的意思，也就是说一个类如果实现了这个接口，那么这个类就是可以比较的。类似的还有cloneable接口表示可以克隆的。而Comparator则是一个比较器，是创建TreeMap的时候传入，用来指定比较规则。

5.ArrayList和LinkedList有哪些区别？

常用的ArrayList和LinkedList的区别总结如下。

ArrayList底层使用了动态数组实现，实质上是一个动态数组
LinkedList底层使用了双向链表实现，可当作堆栈、队列、双端队列使用
ArrayList在随机存取方面效率高于LinkedList
LinkedList在节点的增删方面效率高于ArrayList
ArrayList必须预留一定的空间，当空间不足的时候，会进行扩容操作
LinkedList的开销是必须存储节点的信息以及节点的指针信息

解析：

该题是集合中最常见和最基础的题目之一，List集合也是我们平时使用很多的集合。List接口的常见实现就算ArrayList和LinkedList，我们必须熟练掌握其底层实现以及一些特性。其实还有一个集合Vector，它是线程安全的ArrayList，但是已经被废弃，不推荐使用了。多线程环境下，我们可以使用CopyOnWriteArrayList替代ArrayList来保证线程安全。

ArrayList扩容机制

ArrayList 默认容量大小是0 。当调用方法add()的时候，会自动把容量扩大为10，当容量大于10的时候，将会按照1.5倍继续扩大，当ArrayList容量不足以容纳全部元素时，ArrayList会重新设置容量，主要调用grow方法。

//真正实现扩容的方法
	 private void grow(int minCapacity) {
        // overflow-conscious code
        int oldCapacity = elementData.length;
       //新的容量是在原有的容量基础上+50% 右移一位就是二分之一，即为原来的1.5倍
        int newCapacity = oldCapacity + (oldCapacity >> 1);
        //如果新容量小于最小容量，按照最小容量进行扩容
        if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
       //判断容量是否到达设定的数组列表最大临界值，是则需要进行继续处理，此处不再叙述。
        if (newCapacity - MAX_ARRAY_SIZE > 0)
            newCapacity = hugeCapacity(minCapacity);
        // minCapacity is usually close to size, so this is a win:
        //复制数组
        elementData = Arrays.copyOf(elementData, newCapacity);
    }

6.HashSet和TreeSet有哪些区别？

HashSet和TreeSet的区别总结如下。

HashSet底层使用了Hash表实现。
保证元素唯一性的原理：判断元素的hashCode值是否相同。如果相同，还会继续判断元素的equals方法，是否为true

TreeSet底层使用了红黑树来实现。
保证元素唯一性是通过Comparable或者Comparator接口实现

解析：

其实，HashSet的底层实现还是HashMap，只不过其只使用了其中的Key，具体如下所示：

HashSet的add方法底层使用HashMap的put方法将key = e，value=PRESENT构建成key-value键值对，当此e存在于HashMap的key中，则value将会覆盖原有value，但是key保持不变，所以如果将一个已经存在的e元素添加中HashSet中，新添加的元素是不会保存到HashMap中，所以这就满足了HashSet中元素不会重复的特性。
HashSet的contains方法使用HashMap得containsKey方法实现

7.LinkedHashMap和LinkedHashSet有了解吗？

LinkedHashMap在面试题中还是比较常见的。LinkedHashMap可以记录下元素的插入顺序和访问顺序，具体实现如下：

LinkedHashMap内部的Entry继承于HashMap.Node，这两个类都实现了Map.Entry<K,V>
LinkedHashMap的Entry不光有value，next，还有before和after属性，这样通过一个双向链表，保证了各个元素的插入顺序
通过构造方法public LinkedHashMap(int initialCapacity,float loadFactor,boolean accessOrder)， accessOrder传入true可以实现LRU缓存算法（访问顺序）
LinkedHashSet 底层使用LinkedHashMap实现，两者的关系类似与HashMap和HashSet的关系，大家可以自行类比。

public class LRUTest {
 
    private static int size = 5;
 
    public static void main(String[] args) {
        Map<String, String> map = new LinkedHashMap<String, String>(size, 0.75f, true) {
            @Override
            protected boolean removeEldestEntry(Map.Entry<String, String> eldest) {
                return size() > size;
            }
        };
        map.put("1", "1");
        map.put("2", "2");
        map.put("3", "3");
        map.put("4", "4");
        map.put("5", "5");
        System.out.println(map.toString());
 
        map.put("6", "6");
        System.out.println(map.toString());
        map.get("3");
        System.out.println(map.toString());
        map.put("7", "7");
        System.out.println(map.toString());
        map.get("5");
        System.out.println(map.toString());
    }
}

8.List和Set的区别？

List和Set的区别可以简单总结如下。

List是有序的并且元素是可以重复的
Set是无序（LinkedHashSet除外）的，并且元素是不可以重复的
（此处的有序和无序是指放入顺序和取出顺序是否保持一致）

9.Iterator和ListIterator的区别是什么？

常见的两种迭代器的区别如下。

Iterator可以遍历list和set集合；ListIterator只能用来遍历list集合
Iterator前者只能前向遍历集合；ListIterator可以前向和后向遍历集合
ListIterator其实就是实现了前者，并且增加了一些新的功能。

Iterator其实就是一个迭代器，在遍历集合的时候需要使用。Demo实现如下：

ArrayList<String> list =  new ArrayList<>();
list.add("zhangsan");
list.add("lisi");
list.add("yangwenqiang");
// 创建迭代器实现遍历集合
Iterator<String> iterator = list.iterator();
while(iterator.hasNext()){
    System.out.println(iterator.next());
}

10.几个需要熟记的集合类图

在这里插入图片描述

ICoder_Next

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
面试准备系列——Java基础技术篇（9）/Java集合（2）高频问题收集

文章目录1.Map，List和Set都是Collection的子接口吗？2.说说Java中常见的集合（重点）3.HashMap和Hashtable的区别有哪些？HashMap是线程不安全的是吧？你可以举一个例子吗？HashMap底层实现结构有了解吗？HashMap的初始容量，加载因子，扩容增量是多少？HashMap的长度为什么是2的幂次方？HasMap的存储和获取原理HasMap的扩容步骤解决Hash冲突的方法有哪些？哪些类适合作为HashMap的键？ConcurrentHashMap和Hashtable的
复制链接

扫一扫

专栏目录