文章目录
- 1. Java集合框架
- 2. 为什么数组索引从0开始呢?
- 3. 操作数组的时间复杂度
- 4. ArrayList底层的实现原理是什么
- 5. ArrayList list = new ArrayList(10)中的list扩容几次
- 6. 如何实现数组和List之间的转换
- 7. 用Array.asList转List后,如果修改了数组内容,list受影响吗?List用toArray转数组后,如果修改了List内容,数组受影响吗?
- 8. ArrayList和LinkedList的区别是什么?
- 9. HashMap和HashSet区别
- 10. HashMap实现原理
- 11. HashMap的jdk1.7和jdk1.8有什么区别
- 12. HashMap的put方法的具体流程
- 13. 讲一讲HashMap的扩容机制
- 14. hashMap的寻址算法
- 15. 为何HashMap的数组长度一定是2的次幂
- 16. HashMap在1.7情况下的多线程死循环问题
- 17. 为什么负载因子为0.75
1. Java集合框架
2. 为什么数组索引从0开始呢?
● 在根据数组索引获取元素的时候,会用索引和寻址公式来计算内存所对应的元素数据,寻址公式是:数组的首地址+索引乘以存储数据的类型大小
● 如果数组的索引从1开始,寻址公式中,就需要增加一次减去的操作,对于CPU来说就多了一个指令,性能不高
3. 操作数组的时间复杂度
查询
- 随机查询 O(1)
- 未知索引查询
a. 情况一:查找数组内的元素 O(n)
b. 情况二:查找排序后数组内的元素 O(log n)
插入、删除
为了保证数组的内存连续性,需要挪动数组元素,平均时间复杂度为O(n),如果要是直接插入到结尾,那是O(1)
4. ArrayList底层的实现原理是什么
回答:
- ArrayList底层是用动态的数组实现的
- ArrayList初始容量为0,当第一次添加数据的时候才会初始化容量为10
- ArrayList在进行扩容的时候是原来容量的1.5倍,每次扩容都需要拷贝数组
- ArrayList在添加数据的时候
- 确保数组已使用长度(size)加1之后足够存下下一个数据
- 计算数组的容量,如果当前数组已使用长度+1后的大于当前的数组长度,则调用grow方法扩容(原来的1.5倍)
- 确保新增的数据有地方存储之后,则将新元素添加到位于size的位置上
- 返回添加成功布尔值
5. ArrayList list = new ArrayList(10)中的list扩容几次
该语句只是声明和实例了一个ArrayList,指定了容量为10,未扩容
6. 如何实现数组和List之间的转换
● 数组转List,使用JDK中java.util.Arrays工具类的asList方法
● List转数组,使用List的toArray方法。无参toArray方法返回Object数组,传入初始化长度的数组对象,返回该对象数组
7. 用Array.asList转List后,如果修改了数组内容,list受影响吗?List用toArray转数组后,如果修改了List内容,数组受影响吗?
● Array.asList转换list之后,如果修改了数组的内容,list会受影响,因为它的底层使用的Arrays类中的一个内部类ArrayList来构造的集合,在这个集合的构造器中,把我们传入的这个集合进行了包装而已,最终指向的都是同一个内存地址
● list用了toArray转数组后,如果修改了list内容,数组不会影响,当调用了toArray以后,在底层是它是进行了数组的拷贝,跟原来的元素没啥关系了,所以即使list修改之后,数组也不受影响
8. ArrayList和LinkedList的区别是什么?
- 底层数据结构
- ArrayList 是动态数组的数据结构实现
- LinkedList 是双向链表的数据结构实现
- 操作数据效率
- ArrayList按照下标查询的时间复杂度O(1)【内存是连续的,根据寻址公 式】, LinkedList不支持下标查询
- 查找(未知索引): ArrayList需要遍历,链表也需要遍历,时间复杂度都 是O(n)
- 新增和删除
- ArrayList尾部插入和删除,时间复杂度是O(1);其他部分增删需要挪动 数组,时间复杂度是O(n)
- LinkedList头尾节点增删时间复杂度是O(1),其他都需要遍历链表,时间复杂度是O(n)
- 内存空间占用
- ArrayList底层是数组,内存连续,节省内存
- LinkedList 是双向链表需要存储数据,和两个指针,更占用内存
- 线程安全
- ArrayList和LinkedList都不是线程安全的
- 如果需要保证线程安全,有两种方案:
- 在方法内使用,局部变量则是线程安全的
- 使用线程安全的ArrayList和LinkedList
9. HashMap和HashSet区别
HashSet底层是基于HashMap实现的
10. HashMap实现原理
- 底层使用hash表数据结构,即数组+(链表|红黑树)
- 添加数据时,计算Key的值确定元素在数组中的下标
- Key相同则替换
- 不同则存入链表或红黑树中
获取数据通过Key的hash计算数组下标获取元素
11. HashMap的jdk1.7和jdk1.8有什么区别
● JDK1.8之前采用的拉链法,数组+链表
● JDK1.8之后采用数组+链表+红黑树,链表长度大于8且数组长度大于64则会从链表转化为红黑树
12. HashMap的put方法的具体流程
- 判断键值对数组table是否为空或为null,否则执行resize()进行扩容(初始
化) - 根据键值key计算hash值得到数组索引
- 判断table[i]==null,条件成立,直接新建节点添加
- 如果table[i]==null ,不成立
4.1 判断table[i]的首个元素是否和key一样,如果相同直接覆盖value
4.2 判断table[i] 是否为treeNode,即table[i] 是否是红黑树,如果是红黑树,
则直接在树中插入键值对
4.3 遍历table[i],链表的尾部插入数据,然后判断链表长度是否大于8,大于8
的话把链表转换为红黑树,在红黑树中执行插入操 作,遍历过程中若发现key
已经存在直接覆盖value - 插入成功后,判断实际存在的键值对数量size是否超多了最大容量
threshold(数组长度*0.75),如果超过,进行扩容。
13. 讲一讲HashMap的扩容机制
- 在添加元素或初始化的时候需要调用resize方法进行扩容,第一次添加数据初始化长度为16,以后每次扩容都是达到了扩容阈值(数组长度*0.75)
- 每次扩容的时候,都是扩容之前容量的2倍
- 扩容之后,会新创建一个数组,需要把老数组中的数据挪动到新的数组中
- 没有hash冲突的节点,则直接使用e.hash & (newCap - 1)计算新数组的索引位置
- 如果是红黑树,走红黑树的添加
- 如果是链表,则需要遍历链表,可能需要拆分链表,判断(e.hash & oldCap)是否为0,该元素的位置要么停留在原始位置,要么移动到原始位置+增加的数组大小这个位置上
14. hashMap的寻址算法
这个哈希方法首先计算出key的hashCode值,然后通过这个hash值右移16位 后的二进制进行按位异或运算得到最后的hash值。
在putValue的方法中,计算数组下标的时候使用hash值与数组长度取模得到 存储数据下标的位置,hashmap为了性能更好,并没有直接采用取模的方式,而是使用了数组长度-1 得到一个值,用这个值按位与运算hash值,最终 得到数组的位置。
15. 为何HashMap的数组长度一定是2的次幂
- 计算索引时效率更高:如果是2的n次幂可以使用位与运算代替取模
- 扩容时重新计算索引效率更高:hash & oldCap == 0 的元素留在原来位置,否则新位置 = 旧位置 + oldCap
16. HashMap在1.7情况下的多线程死循环问题
jdk7的的数据结构是:数组+链表 在数组进行扩容的时候,因为链表是头插法,在进行数据迁移的过程中,有 可能导致死循环
比如说,现在有两个线程
线程一:读取到当前的hashmap数据,数据中一个链表,在准备扩容时,线程二介入
线程二也读取hashmap,直接进行扩容。因为是头插法,链表的顺序会进行 颠倒过来。比如原来的顺序是AB,扩容后的顺序是BA,线程二执行结束。
当线程一再继续执行的时候就会出现死循环的问题。
线程一先将A移入新的链表,再将B插入到链头,由于另外一个线程的原因, B的next指向了A,所以B->A->B,形成循环。
当然,JDK 8 将扩容算法做了调整,不再将元素加入链表头(而是保持与扩 容前一样的顺序),尾插法,就避免了jdk7中死循环的问题。
17. 为什么负载因子为0.75
- 根据牛顿二项式计算出来的时间和空间比最好的权衡的值为0.693
- 因为容量必须是2的幂次方,所以为了保证容量*负载因子是一个整数,取值0.75是比较合理的值