目录
这里写目录标题
Java集合容器
一、List和Set的区别
List(对付顺序的好帮⼿): List接⼝存储⼀组不唯⼀(可以有多个元素引⽤相同的对象),有序的对象
Set(注重独⼀⽆⼆的性质): 不允许重复的集合。不会有多个元素引⽤相同的对象。
总结:
List:有序可重复
Set:无序不可重复
二、Arraylist 与 LinkedList 区别?
1,底层数据结构的差异
ArrayList,数组,连续一块内存空间
LinkedList,双向链表,不是连续的内存空间
2,一个常规的结论虽然不严谨, 但也可以应付很多面试了
ArrayList,查找快,因为是连续的内存空间,方便寻址,但删除,插入慢,因为需要发生数据迁移
LinkedList,查找慢,因为需要通过指针一个个寻找,但删除,插入块,因为只要改变前后节点的指针指向即可。
3,ArrayList细节分析
1,增加添加到末尾,正常不需要做特别的处理,除非现有的数组空间不够了,需要扩容数组初始化容量多大?10,当你知道需要存储多少数据时,建议在创建的时候,直接设置初始化大小怎么扩容?当发现容量不够之后,就进行扩容按原先数组容量的1.5倍进行扩容,位运算,下面是关键的源码
> int oldCapacity = elementData.length; int newCapacity = oldCapacity +
> (oldCapacity >> 1);
再将原先数组的元素复制到新数组,Arrays
elementData =Arrays.copyOf(elementData,newCapacity)
添加到其他位置,这个时候需要做整体的搬迁
2,删除删除末尾,并不需要迁移删除其他的位置,这个时候也需要搬迁
3,修改修改之前,必须先定位定位-查找-ArrayList(数组是一段连续的内存空间,定位会特别快)
4,查找如上所述
4.内存空间的占用
ArrayList的空间浪费主要体现在在list列表的结尾会预留⼀定的容量空
间,⽽LinkedList的空间花费则体现在它的每⼀个元素都需要消耗⽐ArrayList更多的空间(因
为要存放直接后继和直接前驱以及数据)。
三、谈谈HashSet的存储原理
HashSet
底层数据结构是哈希表。(无序,唯一)
如何来保证元素唯一性?
1.依赖两个方法:hashCode()和equals()
HashSet的存储原理或者工作原理,主要是从如何保证唯一性来说起。这里面主要有3个问题,需要回答?
第一,为什么要采用Hash算法?有什么优势,解决了什么问题?
解决的问题是唯一性存储数据,底层采用的是数组当我们往数组放数据的时候,你如何判断是否唯一?可以采用遍历的方式,逐个比较,但是这种效率低,尤其是数据很多的情况下所以,为了解决这个效率低的问题,我们采用新的方式采用hash算法,通过计算存储对象的hashcode,然后再跟数组长度-1做位运算,得到我们要存储在数组的哪个下标下,如果此时计算的位置没有其他元素,直接存储,不用比较。此处,我们只会用到hashCode但是随着元素的不断添加,就可能出现“哈希冲突”,不同的对象计算出来的hash值是相同的,这个时候,我们就需要比较,才需要用到equals方法如果equals相同,则不插入,不相等,则形成链表
第二,所谓哈希表是一张什么表?
本质是一个数组,而且数组的元素是链表
第三,HashSet如何保证保存对象的唯一性?会经历一个什么样的运算过程?
set集合在调用add()的时候,add()会调用元素的hasCode和equals方法来判断元素是否会重复。
只有当调用hasCode()时,哈希值相同和equals()返回true时才会判断相同。
四、HashMap的底层原理
1.底层数据结构
JDK1.8 之前 HashMap 底层是 数组和链表 结合在⼀起使⽤也就是 链表散列。
2.HashMap中put方法的过程?
答:“调用哈希函数获取Key对应的hash值,再计算其数组下标;
如果没有出现哈希冲突,则直接放入数组;如果出现哈希冲突,则以链表的方式放在链表后面;
如果链表长度超过阀值( TREEIFY THRESHOLD==8),就把链表转成红黑树,链表长度低于6,就把红黑树转回链表;
如果结点的key已经存在,则替换其value即可;
如果集合中的键值对大于12,调用resize方法进行数组扩容。”
3.数组扩容的过程?
创建一个新的数组,其容量为旧数组的两倍,并重新计算旧数组中结点的存储位置。结点在新数组中的位置只有两种,原下标位置或原下标+旧数组的大小。
五、HashMap 和 Hashtable 和ConcurrentHashMap的区别
Hashtable是线程安全的,但效率低
HashMap是线程不安全的,但效率高
ConcurrentHashMap兼顾了线程安全和效率的问题
分段锁
六、HashMap 的长度为什么是2的幂次⽅
为了能让 HashMap 存取⾼效,尽量少碰撞,也就是要尽量把数据分配均匀。
这个数组下标的计算⽅法是“ (n - 1) & hash
这个算法应该如何设计呢?
我们⾸先可能会想到采⽤%取余的操作来实现。但是,重点来了:“取余(%)操作中如果除数是2的幂次则等价于与其除数减⼀的与(&)操作(也就是说 hash%length等于hash&(length-1)的前提是 length 是2的n 次⽅;)。” 并且 采⽤⼆进制位操作 &,相对于%能够提⾼运算效率
这就解释了 HashMap 的⻓度为什么是2的幂次⽅。