java集合是我们开发中经常会用到的,主要包括map、list、set三种
上面这个图总结了java集合常用类之间的相互关系,list和set继承了collection接口,本身它们两个也是接口,map也是接口,和collection并列,collection同时也继承了iterable迭代接口,都可以通过iterator来遍历。
1、List
list定义的是一种有序的可重复的集合类型,其查询数据的效率比较高,删除和插入数据的效率较低
ArrayList:内部通过数组实现,数组长度动态可变,允许对其数据进行随机访问,插入和删除数据速度慢,线性不安全
LinkedList:内部通过链表的形式实现,相比ArrayList,插入和删除的速度更快,但访问数据的速度较慢,线性不安全
Vector:内部实现和ArrayList一样,是线性安全的,为多线程时使用
ArrayList和LinkedList的区别
ArrayList是基于数组实现的,ArrayList线程不安全。
LinkedList是基于双链表实现的:
使用场景:
(1)如果应用程序对各个索引位置的元素进行大量的存取或删除操作,ArrayList对象要远优于LinkedList对象;
( 2 ) 如果应用程序主要是对列表进行循环,并且循环时候进行插入或者删除操作,LinkedList对象要远优于ArrayList对象;
ArrayList 与 Vector 的区别
ArrayList 有三个构造方法:
public ArrayList(intinitialCapacity)// 构造一个具有指定初始容量的空列表。
public ArrayList()// 构造一个初始容量为 10 的空列表。public ArrayList(Collection<? extends E> c)// 构造一个包含指定 collection 的元 素的列表
Vector 有四个构造方法:
public Vector() // 使用指定的初始容量和等于零的容量增量构造一个空向量。
public Vector(int initialCapacity) // 构造一个空向量,使其内部数据数组的大小,其 标准容量增量为零。
public Vector(Collection<? extends E> c)// 构造一个包含指定 collection 中的元 素的向量
public Vector(int initialCapacity, int capacityIncrement)// 使用指定的初始容量 和容量增量构造一个空的向量
ArrayList 和 Vector 都是用数组实现的,主要有这么四个区别:
1)Vector 是多线程安全的,线程安全就是说多线程访问代码,不会产生不确定的 结果。而 ArrayList 不是,这可以从源码中看出,Vector 类中的方法很多有
synchronied 进行修饰,这样就导致了 Vector 在效率上无法与 ArrayLst 相比;
2)两个都是采用的线性连续空间存储元素,但是当空间充足的时候,两个类的增 加方式是不同。
3)Vector 可以设置增长因子,而 ArrayList 不可以。
4)Vector 是一种老的动态数组,是线程同步的,效率很低,一般不赞成使用。
适用场景:
1.Vector 是线程同步的,所以它也是线程安全的,而 ArraList 是线程异步的,是 不安全的。如果不考虑到线程的安全因素,一般用 ArrayList 效率比较高。
2.如果集合中的元素的数目大于目前集合数组的长度时,在集合中使用数据量比 较大的数据,用 Vector 有一定的优势。
2、set
set定义的是一种无序的,不可重复的集合类型,随便set里面的元素是无序的,但默认是根据hashcode来排序的,重复的数据会被覆盖掉,放入set的object必须实现equals方法,遍历只能通过迭代器来实现
HashSet:按照哈希算法来存取元素,存取的速度较快,其内部包含一个hashMap集合
TreeSet:内部包含treeMap集合,可通过comparator接口进行排序
HashSet 与 TreeSet 的区别
1.TreeSet 是二叉树(红黑树的树据结构)实现的,Treest 中的数据是自动排好序的,不允许放入 null 值。
2.HashSet 是哈希表实现的,HashSet 中的数据是无序的可以放入 null,但只能 放入一个 null,两者中的值都不重复,就如数据库中唯一约束。
3.HashSet 要求放入的对象必须实现 HashCode()方法,放的对象,是以 hashcode 码作为标识的,而具有相同内容的 String 对象,hashcode 是一样,所以放入的 内容不能重复但是同一个类的对象可以放入不同的实例。
适用场景分析:
HashSet 是基于 Hash 算法实现的,其性能通常都优于 TreeSet。为快速查找而 设计的 Set,我们通常都应该使用 HashSet,在我们需要排序的功能时,我们才使用 TreeSet。
3、Map
map定义的是一种键值对的映射关系的集合,键不可重复,值可以重复,元素的存取是无序的
HashMap:允许空值和空键,底层数组+链表实现。插入和查询“键值对”的开销是固定的,可以通过构造器设置容量capacity和负载因子load factor,以调整容器的性能,线程不安全
LinkedHashMap:类似HashMap,其内部通过链表形式维护元素的顺序,迭代访问的时候速度较快
TreeMap:基于红黑树数据结构的实现,实现了sortedMap接口,是有序的Map,通过comparator接口进行排序
HashTable:线性安全,不允许空键,定义键的类必须实现hashcode()方法和equal()方法,底层数组+链表实现
ConcurrentHashMap:底层采用分段的数组+链表实现,线程安全,效率比hashTable高,通过把整个Map分为N个Segment,可以提供相同的线程安全,但是效率提升N倍
而Hashtable的synchronized是针对整张Hash表的
ArrayMap和HashMap的区别
1、存储方式不同
HashMap内部有一个HashMapEntry<K, V>[]对象,每一个键值对都存储在这个对象里,当使用put方法添加键值对时,就会new一个HashMapEntry对象,
2、添加数据时扩容时的处理不一样,进行了new操作,重新创建对象,开销很大。ArrayMap用的是copy数据,所以效率相对要高。
3、ArrayMap提供了数组收缩的功能,在clear或remove后,会重新收缩数组,是否空间
4、ArrayMap采用二分法查找;
HashMap和HashTable的区别
HashMap不是线程安全的,效率高一点、方法不是Synchronize的要提供外同步,有containsvalue和containsKey方法。
hashtable是,线程安全,不允许有null的键和值,效率稍低,方法是是Synchronize的。有contains方法方法。Hashtable 继承于Dictionary 类