一直没有好好整理一下关于集合的知识点,今天闲了来弄弄。
1、List :有序,可以重复的集合。
List 接口的三个典型实现:
①、ArrayList:底层数据结构是数组,查询快,增删慢;线程不安全,效率高
②、Vector:底层数据结构是数组,查询快,增删慢;线程安全,效率低,几乎已经淘汰了这个集合
③、LinkedList:底层数据结构是链表,查询慢,增删快;线程不安全,效率高
2、Set:典型实现 HashSet()是一个无序,不可重复的集合
1、HashSet:不能保证元素的顺序;不可重复;不是线程安全的;集合元素可以为 NULL,但由于不能重复,最多只可以有一个。
2、其底层其实是一个数组,存在的意义是加快查询速度。我们知道在一般的数组中,元素在数组中的索引位置是随机的,元素的取值和元素的位置之间不存在确定的关系,因此,在数组中查找特定的值时,需要把查找值和一系列的元素进行比较,此时的查询效率依赖于查找过程中比较的次数。而 HashSet 集合底层数组的索引和值有一个确定的关系:index=hash(value),那么只需要调用这个公式,就能快速的找到元素或者索引。
3、对于 HashSet: 如果两个对象通过 equals() 方法返回 true,这两个对象的 hashCode 值也应该相同。
1、当向HashSet集合中存入一个元素时,HashSet会先调用该对象的hashCode()方法来得到该对象的hashCode值,然后根据hashCode值决定该对象在HashSet中的存储位置
1.1、如果 hashCode 值不同,直接把该元素存储到 hashCode()定的位置
1.2、如果 hashCode 值相同,那么会继续判断该元素和集合对象的 equals() 作比较
1.2.1、hashCode 相同,equals 为 true,则视为同一个对象,不保存在 hashSet()中
1.2.2、hashCode 相同,equals 为 false,则存储在之前对象同槽位的链表上,这非常麻烦,我们应该约束这种情况,即保证:如果两个对象通过 equals() 方法返回 true,这两个对象的 hashCode 值也应该相同。
三个 Set 接口的实现类比较:
共同点:1、都不允许元素重复
2、都不是线程安全的类,解决办法:Set set = Collections.synchronizedSet(set 对象)
不同点:
1、HashSet:不保证元素的添加顺序,底层采用哈希表算法,查询效率高。判断两个元素是否相等,equals()方法返回true且hashCode() 值相等。即要求存入 HashSet 中的元素要覆盖 equals() 方法和 hashCode()方法
2、LinkedHashSet:HashSet 的子类,底层采用了哈希表算法以及链表算法,既保证了元素的添加顺序,也保证了查询效率。但是整体性能要低于HashSet
3、TreeSet:不保证元素的添加顺序,但是会对集合中的元素进行排序。底层采用红-黑树算法(树结构比较适合范围查询)
3、Map:key-value 的键值对,key 不允许重复,value 可以
1、严格来说 Map 并不是一个集合,而是两个集合之间 的映射关系。
2、这两个集合没每一条数据通过映射关系,我们可以看成是一条数据。即 Entry(key,value)。Map 可以看成是由多个 Entry 组成。
3、因为 Map 集合即没有实现于 Collection 接口,也没有实现 Iterable 接口,所以不能对 Map 集合进行 for-each 遍历。
几个主要实现:
1、HashMap:采用哈希表算法,Key不会保证添加的先后顺序且不允许重复。key判断重复的标注是:两个key的equals() 方法返回 true,两个key的 hashCode 值也应该相同。----->简直就是HashSet!
2、TreeMap:采用红黑树算法,key会按照自然顺序或者定制顺序进行排序,key当然也不允许重复,key重复判断标准是:compareTo()/compare()返回值是否为零。----->简直就是TreeSet!
3、LinkedHashMap:采用链表和哈希表算法,此时Map中的key会保证先后添加的顺序,key重复判断标准和HashMap相同。----->简直就是LinkedHashSet!
4、Hashtable:采用Hash表算法,是HashMap的前身,所有方法都用synchronized修饰符,是线程安全的,效率较低。
5、Properties:Hashtable的子类,此时要求key和value都是String类型的。一般用于加载资源文件。
Set集合就是由Map集合的Key组成。