Android 2020年面试系列(01 — Java 集合)

三月你好 。但愿三月可以花开疫散 。

 

俗话说 “面试造航母 ,工作拧螺丝”。虽然这有点夸大的意思  ,但是如果不能向面试官证明你可以造航母 ,那你可能连拧螺丝的机会都没有。(还有就是面试官问的问题 ,不一定在每个版本迭代的时候都能使用上 ,但是在你在职期间一定会用到的。)

2020 年面试系列文章 ,属于总结性文章 ,会把一些公认的面试技术点整理出来,并且附上每个技术点的原理和博客 。目的是对面试前的技术储备 。

业内公认的面试金三银四 ,今年的面试黄金时期可能会推迟到金五银六等等 。所以尽量在五月份之前完成这个系列 。这个系列文章不会超过十篇 ,我不太喜欢那种大而全的东西 ,目前我希望这个系列属于某些技术点的认识 (面试必问的技术点)。我希望看完这个系列的文章可以对找工作的小伙伴有所帮助 。

 

面试交流群:(欢迎老哥们加入)

 

 

本篇文章主要是介绍 Java 集合的知识 ,着重分析的是 HashMap 跟 ConcurrentHashMap 。

 

 

 

Java 技术点 集合

如果有人说在面试的时候没有遇到过问 Java 集合技术点的面试官 。我会说我不信  ,你遇到的面试官是假的吧 。

。。。

OK 言归正传 。 附上一个集合关系图

所有集合类都位于java.util包下。Java的集合类主要由两个接口派生而出:CollectionMap,Collection和Map是Java集合框架的根接口。

附图说明

1.  Collection 是一个高度抽象出来的集合接口 ,包含了集合的顶层函数 。Collection 集合分为 List 和 Set 两大分支 。

    1.1  List 是一个有序的队列,每一个元素都有它的索引 。第一个元素的索引值是0 。List的实现类有LinkedList , ArrayList , Vector , Stack 。

    1.2  Set 是一个不允许有重复元素的集合 。Set 的实现类有 HastSet 和 TreeSetHashSet依赖于HashMap,它实际上是通过HashMap实现的 ;TreeSet依赖于TreeMap ,它实际上是通过TreeMap实现的 。

 

2.  Map 是一个映射接口 ,即key-value键值对 。Map 中的每一个元素包含 “一个 key ” 和 “ key 对应的 value ”AbstractMap 是个抽象类 ,它实现了 Map 接口中的大部分 API 。而 HashMap ,TreeMap ,WeakHashMap 都是继承于AbstractMap 。Hashtable 虽然继承于 Dictionary ,但它实现了Map接口 。

3.  Iterator遍历集合的工具 ,即我们通常通过 Iterator 迭代器来遍历集合 。我们说 Collection 依赖于 Iterator ,是因为Collection的实现类都要实现 iterator() 函数,返回一个 Iterator 对象。ListIterator 是专门为遍历 List 而存在的 。

4.  Enumeration 是JDK 1.0 引入的抽象类 。作用和 Iterator 一样也是遍历集合 ;但是 Enumeration 的功能要比 Iterator 少。在上面的框图中,Enumeration 只能在 Hashtable , Vector , Stack 中使用 

5.  最后看 Arrays 和 Collections 。它们是操作数组、集合的两个工具类。

 

集合特性 

List 接口(对象按照索引位置排序 ,可以有重复对象 ,允许按照对象在集合中的索引位置检索对象)

    ArrayList   线程不同步 ,数据结构为数组 ,特点:查询快、增删慢 

    LinkedList 线程不同步 ,数据结构为链表 ,特点:查询慢、增删快

    Vector       线程同步 ,数据结构为数组 ,特点:查询慢、增删慢 (过时)

 

 

Set 接口 (不允许有重复元素 ,对象不按特定方式排序 。实现类中的对象可以按特定方式排序 ,也可以实现 Comparator 接口来自定义排序方式)

     HashSet      线程不同步 ,数据结构为哈希表 ,无序 

     LinkedHashSet    线程不同步 ,数据结构为链表 ,有序

     TreeSet    线程不同步 ,数据结构为二叉树 ,有序

 

Map 接口(每一个元素包含一个键值对象 )

     HashMap    线程不同步,数据结构哈希表等等(此集合需要深入分析 ,划重点 ,面试必问题 ,要不赌一个面包机

     LinkedHashMap    线程不同步 ,数据结构为链表 ,保留插入顺序

     HashTab    线程同步 ,数据结构为哈希表 ,键值对都不允许为 null (过时)

     TreeMap    线程不同步 ,数据结构为红黑树 ,保留插入顺序 

     ConcurrentHashMap    线程安全(面试单独问过)

 

Android 集合 

SparseIntArraySparseLongArraySparseBooleanArray 只存储对应类型值

 

(参考文章 https://www.cnblogs.com/xiaoxi/p/6089984.html

PS:线程不同步意味着不安全 ,不安全意味着操作快 ;线程同步意味着安全 ,操作起来就会相对来说慢 。

 

上述是集合的整体分析 ,如果要问那一个集合是面试中必问的, 我想应该是 HashMap 。HashMap 可以说是集合界的实力选手 ,除了一些特定的场景 ,你可以在项目中搜一下  ,HashMap使用的一定是最多的 。接下来余篇就单独对 HashMap进行分析 。要想对 HashMap 有一定的深入 ,除了知道表面的东西之外,分析源码是必须的 。如果没有读过 HaspMap 的源码 ,那一定是死记硬背 。

 

HashMap  

它的底层基于哈希表,采用数组存储数据,使用链表来解决哈希碰撞。在JDK1.8中还引入了红黑树来解决链表长度过长导致的查询速度下降问题。

HashMap 面试能问的真的是太多太多了 。譬如

1.  HashMap 的工作原理是什么?

使用 put(key, value) 存储对象到 HashMap 中,使用 get(key) 从 HashMap 中获取对象。当我们给 put() 方法传递键和值时,我们先对键调用 hashCode() 方法 ,计算并返回的 hashCode 是用于找到 Map 数组的 bucket 位置来储存 Node 对象。

以下是具体的 put 过程(JDK1.8):

  1. 对 Key 求 Hash 值,然后再计算下标。

  2. 如果没有碰撞,直接放入桶中(碰撞的意思是计算得到的 Hash 值相同,需要放到同一个 bucket 中)。

  3. 如果碰撞了,以链表的方式链接到后面。

  4. 如果链表长度超过阀值(TREEIFY THRESHOLD==8),就把链表转成红黑树,链表长度低于6,就把红黑树转回链表。

  5. 如果节点已经存在就替换旧值。

  6. 如果桶满了(容量16*加载因子0.75),就需要 resize(扩容2倍后重排)。

以下是具体 get 过程:

调用 get() 方法,HashMap 会使用键对象的 hashcode 找到 bucket 位置,找到 bucket 位置之后,会调用 keys.equals() 方法去找到链表中正确的节点,最终找到要找的值对象。

 

2.  有什么方法可以减少碰撞?

扰动函数可以减少碰撞。

原理是如果两个不相等的对象返回不同的 hashcode 的话,那么碰撞的几率就会小些。这就意味着存链表结构减小,这样取值的话就不会频繁调用 equal 方法,从而提高 HashMap 的性能(扰动即 Hash 方法内部的算法实现,目的是让不同对象返回不同hashcode)。

使用不可变的、声明作 final 对象,并且采用合适的 equals() 和 hashCode() 方法,将会减少碰撞的发生。不可变性使得能够缓存不同键的 hashcode,这将提高整个获取对象的速度,使用 String、Integer 这样的 wrapper 类作为键是非常好的选择。

 

3.  HashMap 中 hash 函数怎么是实现的?

我们在 hashmap 中要找到某个元素,需要根据 key 的 hash 值来求得对应数组中的位置,如何计算这个位置就是 hash 算法。前面说过,hashmap 的数据结构是数组和链表的结合,所以我们当然希望这个 hashmap 里面的元素位置尽量的分布均匀些,尽量使得每个位置上的元素数量只有一个。那么当我们用 hash 算法求得这个位置的时候,马上就可以知道对应位置的元素就是我们要的,而不用再去遍历链表。 所以,我们首先想到的就是把 hashcode 对数组长度取模运算。这样一来,元素的分布相对来说是比较均匀的。但是“模”运算的消耗还是比较大的,能不能找一种更快速、消耗更小的方式?

   static final int hash(Object key) {
        int h;
    // ^ :按位异或
    // >>>:无符号右移,忽略符号位,空位都以0补齐
    //其中n是数组的长度,即Map的数组部分初始化长度
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

 

简单来说就是:

  • 高16 bit 不变,低16 bit 和高16 bit 做了一个异或(得到的 hashcode 转化为32位二进制,前16位和后16位低16 bit和高16 bit做了一个异或)。

  • (n·1) & hash = -> 得到下标。

 

4.  拉链法导致的链表过深,为什么不用二叉查找树代替而选择红黑树?为什么不一直使用红黑树?

之所以选择红黑树是为了解决二叉查找树的缺陷 :二叉查找树在特殊情况下会变成一条线性结构(这就跟原来使用链表结构一样了 ,造成层次很深的问题),遍历查找会非常慢 。 而红黑树在插入新数据后可能需要通过左旋 、右旋 、变色这些操作来保持平衡 。引入红黑树就是为了查找数据快 ,解决链表查询深度的问题 。我们知道红黑树属于平衡二叉树 ,为了保持“平衡”是需要付出代价的 ,但是该代价所损耗的资源要比遍历线性链表要少 。所以当长度大于8的时候 ,会使用红黑树 ;如果链表长度很短的话 ,根本不需要引入红黑树 ,引入反而会慢 。 

PS:关于二叉树的缺陷 ,这个之前面试的时候也也被问过 ,当时也算是说了一下大概 。还有就是红黑树通过哪些方式来保持平衡的 ?可以参考文章 https://mp.weixin.qq.com/s/jz1ajDUygZ7sXLQFHyfjWA 

 

5.  如果 HashMap 的大小超过了负载因子(load factor)定义的容量怎么办?

HashMap 默认的负载因子大小为0.75。也就是说,当一个 Map 填满了75%的 bucket 时候,和其它集合类一样(如 ArrayList 等),将会创建原来 HashMap 大小的两倍的 bucket 数组来重新调整 Map 大小,并将原来的对象放入新的 bucket 数组中。这个过程叫作 rehashing。当调用 hash 方法找到新的 bucket 位置,这个值只可能在两个地方,一个是原下标的位置,另一种是在下标为 <原下标+原容量> 的位置。

 

PS:关于 HashMap面试问题 ,更多的可以参考 https://mp.weixin.qq.com/s/Ogu4WnxNP38PP3MB0aJjyg

 

源码分析

推荐文章 :https://www.jianshu.com/p/f16bfeeeea88  

搞明白 HaspMap 的原理就可以了 。

 

 

ConcurrentHashMap

ConcurrentHashMap 是 Java 并发包中提供的一个线程安全且高效的 HashMap 实现,以弥补 HashMap 不适合在并发环境中操作使用的不足 。

PS :这个在集合中也算是比较突出的一个集合 。

 

在 Java 中,HashMap 是非线程安全的,如果想在多线程下安全的操作 map,主要有以下解决方法:

  • 第一种方法,使用Hashtable线程安全类;
  • 第二种方法,使用Collections.synchronizedMap方法,对方法进行加同步锁;
  • 第三种方法,使用并发包中的ConcurrentHashMap类;

 

ConcurrentHashMap 类所采用的正是分段锁的思想,将 HashMap 进行切割,把 HashMap 中的哈希数组切分成小数组,每个小数组有 n 个 HashEntry 组成,其中小数组继承自ReentrantLock(可重入锁),这个小数组名叫Segment

 

可参考文章:https://mp.weixin.qq.com/s/CH3gTbf55Cuabstfn2lpFg

 

 

 

 

PS:附上Android 面试题 300道Android 面试题

 

 

 

PS:如有遗漏和其他理解欢迎补充。

如果感觉文章对您有帮助 ,可以关注我的公众号 SuperMaxs (如果有技术问题可以通过公众号加私人微信)。

个人Github 账号 :https://github.com/spuermax

 

 

唯有学习才是大势所趋 。

 

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值