Java面试题(二)

Java面试题(集合专题)

一、 Java集合体系有什么?

集合类存放于 Java.util 包中,主要有 3 种:set(集)、list(列表包含 Queue)和 map(映射)。

  • Collection:Collection 是集合 List、Set、Queue 的最基本的接口。
  • Iterator:迭代器,可以通过迭代器遍历集合中的数据。
  • Map:是映射表的基础接口。
    在这里插入图片描述
    在这里插入图片描述

1. Iterator接口
Iterator接口是一个用于遍历集合中元素的接口,主要包含hashNext(),next(),remove()三种方法。如果实现Iterator接口,那么在遍历集合中元素的时候,只能往后遍历,被遍历后的元素不会在遍历到,通常无序集合实现的都是这个接口,比如HashSet,HashMap
2. LinkedIterator接口:
LinkedIterator在Iterator的基础上又添加了add(),previous(),hasPrevious()三种方法,那些元素有序的集合,实现的一般都是LinkedIterator接口,实现这个接口的集合可以双向遍历,既可以通过next()访问下一个元素,又可以通过previous()访问前一个元素,比如ArrayList。
3. Collection (集合的最大接口)继承关系
 List 可以存放重复的内容
 Set 不能存放重复的内容,所以的重复内容靠hashCode()和equals()两个方法区分
 Queue 队列接口
 SortedSet可以对集合中的数据进行排序
Collection定义了集合框架的共性功能:
在这里插入图片描述
add方法的参数类型是Object。以便于接收任意类型对象。
集合中存储的都是对象的引用(地址)

4. List
凡是可以操作角标的方法都是该体系特有的方法:
在这里插入图片描述

  • ArrayList 线程不安全,查询速度快
  • Vector 线程安全,但速度慢,已被ArrayList替代
  • LinkedList 链表结果,增删速度快
  • TreeList 树型结构,保证增删复杂度都是O(log n),增删性能远高于ArrayList和 LinkedList,但是稍微占用内存

5. Set

  • Set:元素是无序(存入和取出的顺序不一定一致),元素不可以重复

    • HashSet:底层数据结构是哈希表, 是线程不安全的, 数据不同步。
    • HashSet是如何保证元素唯一性的呢?
      是通过元素的两个方法,hashCode和equals来完成。
      如果元素的HashCode值相同,才会判断equals是否为true。
      如果元素的hashcode值不同,不会调用equals。
      注意,对于判断元素是否存在,以及删除等操作,依赖的方法是元素的 hashcode和equals方法。
  • TreeSet:底层数据结构是二叉树,存放有序:TreeSet线程不安全可以对Set集合中的元素进行排序。通过compareTo或者compare方法来保证元素的唯一性。

6. Map
Correction、Set、List接口都属于单值的操作,而Map中的每个元素都使用key——>value的形式存储在集合中。
Map集合:该集合存储键值对, 是key:value一对一对往里存, 而且要保证键的唯一性。
在这里插入图片描述
Map接口的常用子类

  • HashMap:底层数据结构是哈希表,允许使用 null 值和 null 键,该集合是数据不同步的,将hashtable替代,jdk1.2.效率高。
  • TreeMap:底层数据结构是二叉树,线程不同步,可以用于给map集合中的键进行排序。

二、 List 的三个子类的特点

ArrayList 底层结构是数组,底层查询快,增删慢
LinkedList 底层结构是链表型的,增删快,查询慢
Voctor 底层结构是数组 线程安全的,增删慢,查询慢

三、 List 和 Map、Set 的区别

结构特点:
List 和 Set 是存储单列数据的集合,Map 是存储键和值这样的双列数据的集合;

List 中存储的数据是有顺序,并且允许重复;

Map 中存储的数据是没有顺序的,其键是不能重复的,它的值是可以有重复的,Set中存储的数据是无序的,且不允许有重复,但元素在集合中的位置由元素的 hashcode 决定,位置是固定的(Set 集合根据 hashcode 来进行数据的存储,所以位置是固定的,但是位置不是用户可以控制的,所以对于用户来说 set 中的元素还是无序的);
实现类
List 接口有三个实现类(LinkedList:基于链表实现,链表内存是散乱的,每一个元素存储本身内存地址的同时还存储下一个元素的地址。链表增删快,查找慢;ArrayList:基于数组实现,非线程安全的,效率高,便于索引,但不便于插入删除;Vector:基于数组实现,线程安全的,效率低)。

Map 接口有三个实现类(HashMap:基于 hash 表的 Map 接口实现,非线程安全,高效,支持 null 值和 null键;HashTable:线程安全,低效,不支持 null 值和 null 键;LinkedHashMap:是 HashMap 的一个子类,保存了记录的插入顺序;SortMap 接口:TreeMap,能够把它保存的记录根据键排序,默认是键值的升序排序)。

Set 接口有两个实现类(HashSet:底层是由 HashMap 实现,不允许集合中有重复的值,使用该方式时需要重写 equals()和 hashCode()方法;LinkedHashSet:继承与 HashSet,同时又基于 LinkedHashMap 来进行实现,底层使用的是 LinkedHashMp)。

四、HashMap底层实现原理

HashMap根据键的hashCode值存储数据,大多数情况下可以直接定位到它的值.因而具有很快的访问速度,但是遍历顺序却不确定的.HashMap最多只允许一条记录的键为null,允许多条记录的值为null。
HashMap非线程安全,即任一时刻可以有多个线程同时写HashMap,可能会导致数据的不一致。
如果需要满足线程安全,可以用Collections的synchronizedMap方法使HashMap具有线程安全的能力,或者使用ConcurrentHashMap,HashTable.如下详细介绍。

  • JDK1.8之前 (数组+链表)

    • 最开始存入数据的时候
    1. JDK1.8之前HashMap底层是数组和链表结合在一起使用,也就是链表散列.数组的长度规定是2的幂.数组中存放的对象是Entry<key,value>对象 ,不允许有重复的key存在,为什么呢?
    2. 首先,先判断key存放的位置, HashMap通过key的hashCode经过扰动函数处理过后得到hash值,然后通过(n-1)&hash判断当前元素存放的位置(这里的n指的是数组的长度). 也可以理解:key%数组长度=对应数组的索引下标.然后将value存入到entry对象中。
      所谓扰动函数知道就是HashMap的hash方法.使用hash方法也就是扰动函数是为了防止一些实现比较差的hashCode()方法,换句话说使用扰动函数之后可以减少碰撞。
    3. 为什么使用(n-1)&length长度呢?
      (1)保证数组不会越界:
      首先我们要知道,在HashMap和ConcurrentHashMap中,数组的长度按规定一定是2的幂(2的n次方)因此,数组的长度的二进制形式是:10000…000,1后面有一堆0。那么tab.length - 1 的二进制形式就是01111…111,0后面有一堆1。最高位是0, 和hash值相"与",结果值一定不会比数组的长度值大,因此也就不会发生数组越界.
      (2)保证元素尽可能的均匀分布
      在操作的时候,链表中的元素越多,效率越低,因为要不停的对链表循环比较.所以,一定要使哈希均匀分布,尽量减少哈希冲突,提高效率。
    • 继续存入数据
      继续存入数据,还是要通过第1步计算key在数组中的索引位置. 如果当前位置存在元素的话,再通过key的equal()方法判断key是否相同,如果相同value值就会覆盖; 如果key的equals()方法不同,则在数组对应索引位置变为链表存储新的Entry<key,value>。
      • 拉链法
        上一步说到的链表是拉链法: 将链表和数组相结合.也就是说创建一个链表数组,数组中每一格就是一个链表.若约到哈希冲突,则将冲突的值加到链表中即可.
        在这里插入图片描述
  • JDK1.8之后(数组+链表+红黑树)
    如果链表的长度超过8则转为红黑树, 当红黑树中的元素小于6时又变为链表(有这些变化的原因就是综合时间复杂度以及空间复杂度的考虑)获取时,直接找到key的hash值对应的下标,在进一步用equels方法判断key是否相同,从而找到对应值则返回找不到则返回null。
    相比于之前的版本,jdk1.8在解决哈希冲突时有了较大的变化,当链表长度大于阀值(默认为8)时,将链表转化为红黑树,以减少搜索时间。
    在这里插入图片描述
    在这里插入图片描述

五、谈一下 hashMap 中什么时候需要进行扩容,扩容 resize()又是如何实现的?

调用场景:

  1. 初始化数组 table
  2. 当数组 table 的 size 达到阙值时进行扩容

实现过程:
通过判断旧数组的容量是否大于0来判断数组是否初始化过。

  • 如果小于0:进行初始化,判断是否调用无参构造器。
    如果调用了无参构造器: 使用默认的大小和阙值<阈值 12. 阀值=默认 大小为16乘以负载因子0.75。
    如果没有调用无参构造器: 使用构造函数中初始化的容量, 当然这个容 量是经过tableSizefor 计算后的 2 的次幂数) 。

  • 如果大于0: 进行扩容,扩容成两倍(小于最大值的情况下),之后在进行将元素重新进行与运算复制到新的散列表中。

概括的讲:
扩容需要重新分配一个新数组,新数组是老数组的2倍长,然后遍历整个老结构,把所有的元素挨个重新hash分配到新结构中去。PS:可见底层数据结构用到了数组,到最后会因为容量问题都需要进行扩容操作。

六、ConcurrentHashMap特点

Segment 段
ConcurrentHashMap 和 HashMap 思路是差不多的,但是因为它支持并发操作,所以要复杂一些。整个 ConcurrentHashMap 由一个个 Segment 组成,Segment 代表”部分”或”一段“的意思,所以很多地方都会将其描述为分段锁。注意,行文中,我很多地方用了“槽”来代表一个segment。
线程安全(Segment 继承 ReentrantLock 加锁)
简单理解就是,ConcurrentHashMap 是一个 Segment 数组,Segment 通过继承ReentrantLock 来进行加锁,所以每次需要加锁的操作锁住的是一个 segment,这样只要保证每个Segment 是线程安全的,也就实现了全局的线程安全。
在这里插入图片描述

并行度(默认 16)
concurrencyLevel:并行级别、并发数、Segment 数,怎么翻译不重要,理解它。默认是 16,也就是说 ConcurrentHashMap 有 16 个 Segments,所以理论上,这个时候,最多可以同时支持 16 个线程并发写,只要它们的操作分别分布在不同的 Segment 上。这个值可以在初始化的时候设置为其他值,但是一旦初始化以后,它是不可以扩容的。再具体到每个 Segment 内部,其实每个 Segment 很像之前介绍的 HashMap,不过它要保证线程安全,所以处理起来要麻烦些。
Java8 实现 (引入了红黑树)
Java8 对 ConcurrentHashMap 进行了比较大的改动,Java8 也引入了红黑树
在这里插入图片描述

七、HashTable

Hashtable 是遗留类,很多映射的常用功能与 HashMap 类似,不同的是它承自 Dictionary 类,并且是线程安全的,任一时间只有一个线程能写 Hashtable,并发性不如 ConcurrentHashMap,因为 ConcurrentHashMap 引入了分段锁。Hashtable 不建议在新代码中使用,不需要线程安全的场合可以用 HashMap 替换,需要线程安全的场合可以用 ConcurrentHashMap 替换。

八、HashMap 和 HashTable 有什么区别?

HashMap 是线程不安全的,是 Map 的一个实现类,是将键映射到值得对象,不允许键值重复,允许空键和空值;由于非线程安全,HashMap 的效率要较 HashTable 的效率高一些.
HashTable 是线程安全的一个集合,不允许 null 值作为一个 key 值或者 Value 值;
HashTable 是 sychronize,多个线程访问时不需要自己为它的方法实现同步,而 HashMap 在被多个线程访问的时候需要自己为它的方法实现同步;

九、HashMap,HashTable,ConcurrentHashMap之间的区别,及性能对比

性能:ConcurrentHashMap(线程安全) > HashMap > HashTable(线程安全)
区别对比一(HashMap和HashTable区别):
1、HashMap是非线程安全的,HashTable是线程安全的。
2、HashMap的键和值都允许有null值存在,而HashTable则不行。
3、因为线程安全的问题,HashMap效率比HashTable的要高。
4、Hashtable是同步的,而HashMap不是。因此,HashMap更适合于单线程环境,而Hashtable适合于多线程环境。一般现在不建议用HashTable, ①是HashTable是遗留类,内部实现很多没优化和冗余。②即使在多线程环境下,现在也有同步的ConcurrentHashMap替代,没有必要因为是多线程而用HashTable。
区别对比二(HashTable和ConcurrentHashMap区别):
HashTable使用的是Synchronized关键字修饰,ConcurrentHashMap是使用了锁分段技术来保证线程安全的。
Hashtable中采用的锁机制是一次锁住整个hash表,从而在同一时刻只能由一个线程对其进行操作;而ConcurrentHashMap中则是一次锁住一个桶。
ConcurrentHashMap默认将hash表分为16个桶,诸如get、put、remove等常用操作只锁住当前需要用到的桶。这样,原来只能一个线程进入,现在却能同时有16个写线程执行,并发性能的提升是显而易见的。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值