谈一谈你对Java集合的了解
集合类存放在java.util包中。
集合类存放的都是对象的引用,而非对象本身,处于表达上的便利,我们称集合中的对象就是指集合中对象的引用。
集合主要有三种类型:set(无序不可重复),list(有序可重复),map(键值对)
所有的集合类都是实现了collection接口。
HashMap和Hashtable的理解
都是基于哈希表实现的,超过内存容量,会自动增长
都实现了serializable,cloneable接口
Hashtable继承自Dictionary类,而HashMap继承自AbstractMap类。但二者都实现了Map接口。
HashMap底层是一个Entry数组,当发生hash冲突的时候,hashmap是采用链表的方式来解决的,在对应的数组位置存放链表的头结点。对链表而言,新加入的节点会从头结点加入。
hashmap是非线程安全的,hashmap允许键值为空
哈希碰撞/哈希冲突
Hash的前提是实现equals()和hashCode()两个方法,那么HashCode()的作用就是保证对象返回唯一hash值,但当两个对象计算值一样时,这就发生了碰撞冲突。
哈希冲突即关键字不同的元素被映射到了同一个内存位置,包括由同义词冲突和非同义词冲突。
ArrayList和LinkedList
基于Array的List(Vector,ArrayList)适合查询,而LinkedList(链表)适合添加,删除操作。
ArrayList和Vector
Vector是线程安全的集合类,ArrayList并不是线程安全的类。Vector类对集合的元素操作时都加了synchronized,保证线程安全。
Vector与ArrayList的扩容并不一样,Vector默认扩容是增长一倍的容量,Arraylist是增长50%的容量。
HashMap的数据存储和实现原理
HashMap是基于hashing的原理,我们使用put(key, value)存储对象到HashMap中,使用get(key)从HashMap中获取对象。当我们给put()方法传递键和值时,我们先对键调用hashCode()方法,计算并返回的hashCode是用于找到Map数组的bucket位置来储存Node 对象。这里关键点在于指出,HashMap是在bucket中储存键对象和值对象,作为Map.Node 。
hashset和hashmap的区别
HashSet实现了Set接口,它不允许集合中出现重复元素。当我们提到HashSet时,第一件事就是在将对象存储在HashSet之前,要确保重写hashCode()方法和equals()方法,这样才能比较对象的值是否相等,确保集合中没有储存相同的对象
实现了Map接口 实现Set接口 ,存储键值对 仅存储对象,调用put()向map中添加元素调用add()方法向Set中添加元素;HashMap使用键(Key)计算Hashcode ;HashSet使用成员对象来计算hashcode值,对于两个对象来说hashcode可能相同,所以equals()方法用来判断对象的相等性,如果两个对象不同的话,那么返回falseHashMap相对于HashSet较快,因为它是使用唯一的键获取对象
ConcurrentHashMap线程安全的具体实现原理?
HashTable容器在竞争激烈的并发环境下表现出效率低下的原因,是因为所有访问HashTable的线程都必须竞争同一把锁,那假如容器里有多把锁,每一把锁用于锁容器其中一部分数据,那么当多线程访问容器里不同数据段的数据时,线程间就不会存在锁竞争,从而可以有效的提高并发访问效率,这就是ConcurrentHashMap所使用的锁分段技术,首先将数据分成一段一段的存储,然后给每一段数据配一把锁,当一个线程占用锁访问其中一个段数据的时候,其他段的数据也能被其他线程访问。有些方法需要跨段,比如size()和containsValue(),它们可能需要锁定整个表而而不仅仅是某个段,这需要按顺序锁定所有段,操作完毕后,又按顺序释放所有段的锁。这里“按顺序”是很重要的,否则极有可能出现死锁,在ConcurrentHashMap内部,段数组是final的,并且其成员变量实际上也是final的,但是,仅仅是将数组声明为final的并不保证数组成员也是final的,这需要实现上的保证。这可以确保不会出现死锁,因为获得锁的顺序是固定的。
怎么获取一个线程安全的ArrayList
1.collection类自带方法 List list = Collections.synchronizedList(new ArrayList());
2.继承ArrayList,重写方法,给方法加上Synchronized,方法内部调用父类的方法。
TreeMap/TreeSet底层是什么数据结构,怎么实现的自动排序
底层是红黑树,一种自平衡二叉树
for循环和foreach遍历集合那个快
当遍历数组结构的集合时用for或者foreach都行(1、在固定长度或者长度不需要计算的时候for循环效率高于foreach;2、在不确定长度或者计算长度有损性能的时候用foreach比较方便–可以自己测试一下),
当遍历链表结构的集合时一定不要用for循环。
在foreach中,不要进行集合的add,remove操作
如何快速的遍历map集合,哪种方式最快
iterator的迭代器方式比foreach的效率高。
HashSet、TreeSet、LinkedHashSet区别
如果你需要一个访问快速的Set,你应该使用HashSet;当你需要一个排序的Set,你应该使用TreeSet;当你需要记录下插入时的顺序时,你应该使用LinedHashSet。
在什么场景下要重写equals()和hashCode()方法
往hashset中存值时