噢,他明白了,河水既没有牛伯伯说的那么浅,也没有小松鼠说的那么深,只有自己亲自试过才知道。
——寓言故事《小马过河》
数据集可以允许重复,也可以不允许重复,可以允许null存在,也可以不允许null存在,可以自动排序,也可以不自动排序,可以是阻塞式的,也可以是非阻塞式的,可以是栈,也可以是队列……
性能要求较高的场景中使用数组替代集合。
可以通过对数组扩容“婉转”地解决该问题,数组长度不够的问题。
public class Client {
public static <T> T[] expandCapacity(T[] dates, int newLen) {
// 不能是负值
newLen = newLen < 0 ? 0 : newLen;
// 生成一个新数组,并拷贝原值
return Arrays.copyOf(dates, newLen);
}
public static void main(String[] args) {
// 一个班级最多容量60个学生
Stu[] classes = new Stu[60];
// 偶尔一个班级可以容纳80人,数组加长
classes = expandCapacity(classes, 80);
}
}
class Stu {
}
Arrays.copyOf方法产生的数组是一个浅拷贝,数组的clone方法也是浅拷贝,集合的clone方法也都是浅拷贝,在拷贝时需要留心。
使用默认方式声明ArrayList时,初始长度是10。如果不设置初始容量,系统就按照1.5倍的规则扩容,每次扩容都是一次数组的拷贝,如果数据量很大,非常耗费资源,效率低下。如果我们知道一个ArrayList的可能长度,然后对ArrayList设置一个初始容量可以显著提高系统性能。
非常有必要在集合初始化时声明容量。
最值计算时使用集合最简单,使用数组性能最优。
原始类型数组(基本类型数组)不能作为asList的输入参数,否则会引起程序逻辑混乱。
使用Arrays.asList生成集合时,返回的类型ArrayList是在Arrays类下的静态内部类ArrayList,而不是java.util.ArrayList的ArrayList,此静态内部类ArrayList只有5个方法:
1、size 元素数量
2、toArray 转化为数组,实现了数组的浅拷贝
3、get 获得指定元素
4、set 重置某一元素值
5、contains 是否包含某元素
列表遍历不是那么简单的,其中很有“学问”,实时选择最优的遍历方式,不要固化为一种。比如,ArrayList类型遍历用普通for循环,LinkedList类型遍历用foreach。
LinkedList在删除和插入效率高,ArrayList在修改元素效率高。
判断集合是否相等时只须关注元素是否相等即可。
subList产生的列表只是一个视图,所有的修改动作直接作用于原列表。subList生成子列表后,保持原列表的只读状态。
Collections. unmodifiableList()设置列表为只读状态。
Comparable接口可以作为实现类的默认排序,Comparator接口则是一个类的扩展排序工具。一个类稳定、成熟后其compareTo方法基本不会改变,也就是一个类只能有一个固定的、由compareTo方法提供的默认排序算法。compareTo方法是根据根据返回值正负和0来判断的排序的。
从性能方面考虑,binarySearch较之indexOf是最好的选择。
indexOf依赖equals方法查找,binarySearch则依赖compareTo方法查找。
equals是判断元素是否相等,compareTo是判断元素在排序中的位置是否相同。
实现了compareTo方法,就应该覆写equals方法,确保两者相同。
Collections. Shuffle()乱序:
1、可以用在程序的“伪装上”。标签云、游戏中的打怪、修行、群殴宝物分配
2、可以用在抽奖程序中。员工排序随机打乱,在抽奖
3、可以用在安全传输方面。发送端随机打乱发送
尽量让HashMap中的元素少量并简单。HashMap中的hashCode应避免冲突。
Vector是ArrayList的多线程版本,HashTable是HashMap的多线程版本。
基本上所有的集合类都有一个叫做快速失败(Fail-Fast)的校验机制,当一个集合在被多个线程修改并访问时,就可能会出现ConcurrentModificationException异常,这是为了确保集合方法一致而设置的保护措施,线程同步是为了保护集合中的数据不被脏读、脏写而设置的。
TreeSet适用于不变量的集合数据排序,比如String、Integer等类型,但不适用于可变量的排序,特别是不确定何时元素会发生变化的数据集合。对于不变量的排序,例如直接量(也就是8个基本类型)、String类型等,推荐使用TreeSet,而对于可变量,例如我们自己写的类,可能会在逻辑处理中改变其排序关键值的,则建议使用List,使用Collections.sort()方法自行排序。
SorteSet中的元素被修改后可能会影响其排序位置。
集合的大家族:
1、List
实现List接口的集合只要有:ArrayList、LinkedList、Vector、Stack,其中ArrayList是一个动态数组,LinkedList是一个双向链表,Vector是一个线程安全的动态数组,Stack是一个对象栈,遵循先进后出的原则。
2、Set
Set是不包含重复元素的集合,其主要的实现类有:EnumSet、HashSet、TreeSet,其中EnumSet是枚举类型的专用Set,所有元素都是枚举类型;HashSet是以哈希码决定其元素位置的Set,其原理与HashMap相似,它提供快速的插入和查找方法;TreeSet是一个自动排序的Set,它实现了SorteSet接口。
3、Map
Map可以分为排序Map和非排序Map,排序Map主要是TreeMap类,根据Key值进行自动排序;非排序Map主要包括:HashMap、HashTable、Properties、EnumMap等。
4、Queue
队列,分两类,一类是阻塞式队列,队列满了以后再插入元素会抛出异常,主要包括:ArrayBlockingQueue、PriorityBlockingQueue、LinkedBolockingQueue,其中ArrayBlockingQueue是一个以数组方式实现的有界阻塞队列,PriorityBlockingQueue是按照优先级组建的队列,LinkedBolockingQueue是通过链表实现的阻塞队列;另一类是非阻塞队列,无边界的,只要内存允许,都可以追加,常用PriorityQueue类。
5、数组
数组与集合的最大区别就是数组能够容纳基本类型,而集合不行,同时集合底层存储的都是数组。
6、工具类
数组工具类是java.util.Arrays和java.lang.reflect.Array,集合的工具类是java.util.Collections。
7、扩展类
集合类可以自行扩展,可以使用Apache的commons-collections扩展包,也可以使用Google的google-collections扩展包。