collection[set,, list]和map的的特点

最新推荐文章于 2022-01-14 16:56:47 发布

abcd1101

最新推荐文章于 2022-01-14 16:56:47 发布

阅读量615

点赞数

分类专栏：数据结构[逻辑结构]-集合文章标签：数据结构

数据结构[逻辑结构]-集合专栏收录该内容

2 篇文章 0 订阅

订阅专栏

Collection

来源于Java.util包，是非常实用常用的数据结构!!!!!字面意思就是容器。具体的继承实现关系如下图，先整体有个印象，再依次介绍各个部分的方法，注意事项，以及应用场景。

1.List主要子接口对象

│├LinkedList没有同步方法

│├ArrayList非同步的（unsynchronized）

│└Vector(同步) 非常类似ArrayList，但是Vector是同步的

└Stack 它通过五个操作对类 Vector 进行了扩展，允许将向量视为堆栈。记住 push和pop方法，还有peek方法得到栈顶的元素，empty方法测试堆栈是否为空，search方法检测一个元素在堆栈中的位置。注意：Stack刚创建后是空栈。

2.└Set不包含重复的元素
HashSet
SortSet

TreeSet

3.Map

Map没有继承Collection接口，Map提供key到value的映射。

├Hashtable 任何非空（non-null）的对象。同步的

├HashMap 可空的对象。不同步的，但是效率高，较常用。注：迭代子操作时间开销和HashMap的容量成比例。因此，如果迭代操作的性能相当重要的话，不要将HashMap的初始化容量设得过高，或者load factor过低。
└WeakHashMap 改进的HashMap，它对key实行“弱引用”，如果一个key不再被外部所引用，那么该key可以被GC回收。
SortMap--- TreeMap

LinkedList

　4.Queue和List有两个区别：

前者有“队头”的概念，取元素、移除元素、均为对“队头”的操作（通常但不总是FIFO，即先进先出），

而后者只有在插入时需要保证在尾部进行；

LinkedList既是List，也是Queue(Deque)，其原因是它是双向的，内部的元素(Entry)同时保留了上一个和下一个元素的引用。使用头部的引用header，取其previous，就可以获得尾部的引用。通过这一转换，可以很容易实现Deque所需要的行为。也正因此，可以支持栈的行为，天生就有push()和pop()方法。简而言之，是Java中的双向链表，其支持的操作和普通的双向链表一样。
　　和数组不同，根据下标查找特定元素时，只能遍历地获取了，因而在随机访问时效率不如ArrayList。

5.总结：

a.如果涉及到堆栈，队列（先进后出）等操作，应该考虑用List，对于需要快速插入，删除元素，应该使用LinkedList，如果需要快速随机访问元素，应该使用ArrayList。

b.如果程序在单线程环境中，或者访问仅仅在一个线程中进行，考虑非同步的类ArrayList, HashMap，其效率较高，如果多个线程可能同时操作一个类，应该使用同步的类Vector, Hashtable。

c.ArrayList、HashSet/LinkedHashSet、PriorityQueue、LinkedList是线程不安全的，

可以使用synchronized关键字，或者类似下面的方法解决:

List list = Collections.synchronizedList(new ArrayList(...));

d.List、Set、Map是这个集合体系中最主要的三个接口。
其中List和Set继承自Collection接口。
Set不允许元素重复。HashSet和TreeSet是两个主要的实现类。
List 有序且允许元素重复。ArrayList、LinkedList和Vector是三个主要的实现类。
Map也属于集合系统，但和Collection接口不同。Map是key对value的映射集合，其中key列就是一个集合。key不能重复，但是value可以重复。HashMap、TreeMap和Hashtable是三个主要的实现类。
SortedSet和SortedMap接口对元素按指定规则排序，SortedMap是对key列进行排序。

e.Comparable和Comparator区别
A:调用java.util.Collections.sort(List list)方法来进行排序的时候，List内的Object都必须实现了Comparable接口。
java.util.Collections.sort(List list，Comparator c)，可以临时声明一个Comparator 来实现排序。

[java] view plain copy

Collections.sort(imageList, new Comparator() {
public int compare(Object a, Object b) {
int orderA = Integer.parseInt( ( (Image) a).getSequence());
int orderB = Integer.parseInt( ( (Image) b).getSequence());
return orderA - orderB;
}
});

f.ArrayList从其命名中可以看出它是一种类似数组的形式进行存储，因此它的随机访问速度极快，而LinkedList的内部实现是链表，它适合于在链表中间需要频繁进行插入和删除操作。ArrayList从其命名中可以看出它是一种类似数组的形式进行存储，因此它的随机访问速度极快，而LinkedList的内部实现是链表，它适合于在链表中间需要频繁进行插入和删除操作。

哈希表

Hashtable内部用一个Entry数组table，来保存所有的数据。

当我们插入一个新的Entry对象时，即用Hashtable的put(key, value)方法。
在put方法里：
计算key的hash值
计算index值，作为数组table的下标，即table[index]
哈希表中根据key的索引值index，创建了多个bucket，所有index值一样的Entry对象，构造成一个链接表存放在同一个bucket里。既然是一个链接表，根据数据结构知识，自然我们的Entry对象需要有一个指向下一个对象的指针，即Entry对象需要有这些属性：key，value，next。

如何构造hash函数？

hash值，如何生成？对于每个对象的hash值，要保证每一个hash值都不一样。
在Java SDK中， String的hashCode方法如下：

//hash的初始值为0
public int hashCode() {
    int h = hash;
    if (h == 0 && value.length > 0) {
        char val[] = value;

        for (int i = 0; i < value.length; i++) {
            h = 31 * h + val[i];
        }
        hash = h;
    }
    return h;
}

index值，如何生成？这里要求保存的数据是均匀的分配在每一个bucket中，Hashtable源码中采用%操作(mod)使数据分布在编号为0~10的bucket中。
Hashtable中put方法的源码如下：

private int hash(Object k) {
    // hashSeed will be zero if alternative hashing is disabled.
    return hashSeed ^ k.hashCode();
}

public synchronized V put(K key, V value) {
    ... ...
    int hash = hash(key);
    int index = (hash & 0x7FFFFFFF) % tab.length;
    ... ...
}

这样数据存储到哈希表之后，当我们要查找或者说获取一个对象时候，采用同样的方式可以快速的找到我们需要的对象。

哈希表可以快速的找到一个元素。在有大量的数据的时候，比普通的顺序查找要快的多。
假设有10000条数据，如果采用顺序查找，最坏的情况下需要对比10000次能找到，最好的情况是1次。平均查找次数位(10000+1)/2，大约为5000次。
换一种方式，如果把10000条数据通过hash值索引分成10组，每一组有1000条数据，这样每一次只需要先确定是哪一组，然后在1000条数据里查找，这样最坏的情况是1000次，最好的情况是1次。平均查找次数为(1000+1)/2 ，大约为500次。比上面的方法快了5倍。

我们常用的5种算法有顺序查找，二分法查找，二叉排序树查找，哈希表法查找，分块查找。Java的Hashtable即是用了哈希表法查找。