一、Set集合的特点
set集合中存储集合是无序的(除LinkedHashSet),且元素不可以重复(引用数据类型要重写hashcode和equals方法,否则比较的是地址值而不是自身属性,那就都不一样了)
list集合add()方法添加元素,返回值是boolean类型,恒为true,因为list集合可以添加重复元素。而set集合添加元素,返回值可能是false,只要是元素重复就返回false。
二、HashSet
1.HashSet储存基本类型数据(自动装箱,其实存的是他们的包装类的对象),能够保证元素唯一没什么毛病。
2.那么HashSet储存引用数据类型,是怎么保证元素唯一的呢?
首先HashSet在存入元素的时候,会自己调用元素对象的HashCode()方法,比较HashCode()的返回值,若返回值不同,则元素不重复,存入元素;
若返回值相同,则调用equals()方法进行比较,若不相同,则存入元素,并返回true;若相同,则不存入元素,返回false。
所以要求存入HashSet的元素的类要重写这两个方法,否则调用Object的HashCode()返回的是地址值,就没法根据元素的属性区分返回值。为了提高效率,一般尽量少用equals方法,所以要提高重写的HashCode()方法的辨识度,当然直接用系统写的就好了。
系统帮忙重写的HashCode()中有一个参数为31,来扩大差异性,保证元素属性不同的返回值尽量不同,为什么选择31有三个理由;
1.31是一个质数,没有公约数,减少相乘后相同的可能性;
2.31是一个不大不小的数;
3.31比较好算,是2的5次方-1,(2<<5) - 1;
* 1.HashSet原理
* 我们使用Set集合都是需要去掉重复元素的, 如果在存储的时候逐个equals()比较, 效率较低,哈希算法提高了去重复的效率, 降低了使用equals()方法的次数
* 当HashSet调用add()方法存储对象的时候, 先调用对象的hashCode()方法得到一个哈希值, 然后在集合中查找是否有哈希值相同的对象
* 如果没有哈希值相同的对象就直接存入集合
* 如果有哈希值相同的对象, 就和哈希值相同的对象逐个进行equals()比较,比较结果为false就存入, true则不存
* 2.将自定义类的对象存入HashSet去重复
* 类中必须重写hashCode()和equals()方法
* hashCode(): 属性相同的对象返回值必须相同, 属性不同的返回值尽量不同(提高效率)
* equals(): 属性相同返回true, 属性不同返回false,返回false的时候存储
三、LinkedHashSet
* 底层是链表实现的,是set集合中唯一可以保证怎么存就怎么取的集合,又因为是HashSet的子类,所以可以保证元素唯一。
四、TreeSet
TreeSet是可以保证元素唯一并且对元素进行排序的集合,底层是由二叉树来实现的。即有一个树根,小的(差值为负数)排在左边,大的(差值为整数)排在右边,为0的不存入。取的时候,若一个元素的左边没有元素了,它就是最小的,从左向右取。第一个进入的是树根,往后的是比较者,比较者前面的是被比较者。
自然排序:对于自定义的数据类型,要求告诉TreeSet它自己的排序规则,即实现Comparable接口,并且重写其中的CompareTo()方法。
比较器排序:对于已有的数据类型,如String已经实现了Comparable接口,排序规则已经写好了是按照字典顺序排序,而如果我们有其它的排序需求,如按照长度排序等,那么就要自己写一个比较器,即写一个类继承Comparator接口,重写其中的compare()方法,通过TreeSet的构造方法告诉TreeSet你的排序规则。(当然自定义的数据类型也能这么做)。
使用方式
* a.自然顺序(Comparable)
* TreeSet类的add()方法中会把存入的对象提升为Comparable类型
* 调用对象的compareTo()方法和集合中的对象比较
* 根据compareTo()方法返回的结果进行存储
* b.比较器顺序(Comparator)
* 创建TreeSet的时候可以制定 一个Comparator
* 如果传入了Comparator的子类对象, 那么TreeSet就会按照比较器中的顺序排序
* add()方法内部会自动调用Comparator接口中compare()方法排序
* 调用的对象是compare方法的第一个参数,集合中的对象是compare方法的第二个参数
两种方式的区别
* TreeSet构造函数什么都不传, 默认按照类中Comparable的顺序(没有就报错ClassCastException)
* TreeSet如果传入Comparator, 就优先按照Comparator
五、Collection集合的遍历总结
* 1.List
* a.普通for循环, 使用get()逐个获取
* b.调用iterator()方法得到Iterator, 使用hasNext()和next()方法
* c.增强for循环, 只要可以使用Iterator的类都可以用
* d.Vector集合可以使用Enumeration的hasMoreElements()和nextElement()方法
* 2.Set
* a.调用iterator()方法得到Iterator, 使用hasNext()和next()方法
* b.增强for循环, 只要可以使用Iterator的类都可以用
* 3.普通for循环,迭代器,增强for循环是否可以在遍历的过程中删除
* a.普通for循环可以删除,但是删除元素后要--(减减);
* b.迭代器可以删除元素,但是要用迭代器来删除,而不是集合本身,如果用集合本身删除会报并发修改异常;
* c.增强for循环不可以删除,因为底层也是用迭代器来做的,但是却获取不到迭代器的对象,如果用集合本身删除会报并发修改异常,所以不可以删除。