java数据结构及集合框架2

最新推荐文章于 2024-10-01 09:29:45 发布

isTrueLoveColour

最新推荐文章于 2024-10-01 09:29:45 发布

阅读量84

点赞数

文章标签： java

本文链接：https://blog.csdn.net/persistence_PSH/article/details/114156179

版权

文章目录

一、Set接口
- 实现类
一、HashSet
- 常用方法
- HashSet的特征
三、LinkedHashSet
四、TreeSet
- TreeSet的排序
五、哈希表及二叉树
- 哈希表
- 二叉树
六、相关的集合计算

一、Set接口

特点：无序、不允许重复，是Collection接口的子接口，没有定义新方法，所有的方法都是Collection接口中所定义的方法

实现类

HashSet存储采用哈希表的方式进行存储，HashSet采用HashCode算法来存取集合中的元素，因此具有比较好的读取和查找性能
LinkedHashSet是在HashSet的基础上添加一个额外的链表结构可以记录存储数据的顺
TreeSet采用的是树状结构进行数据存储

一、HashSet

类定义，可序列化，可克隆

public class HashSet<E>
    extends AbstractSet<E>
    implements Set<E>, Cloneable, java.io.Serializable
{

构造器，数据以HashMap来实现存储的

 public HashSet() {
        map = new HashMap<>();
    }

数据存储方式：

private transient HashMap<E,Object> map;	
//key为要存储的数据，Value为常量
private static final Object PRESENT = new Object();

常用方法

boolean add(E e)向集合Set中添加元素，注意不保证顺序，元素相同则后盖前

不允许重复的前提是重写hashcode方法与equals方法，因为比对两个对象相等，调用流程为：1、调用对象的hashcode方法，如果hashCode不相等则返回，认为两个对象不相等。2、如果hash值相等则调用equals判断
定义类时需要定义对应的hashCode和equals方法，要求：当equals为true时，hash值必须相等；当hash值相等时不一定equals为true

boolean remove(Object o) 删除指定对象，同样需要hashCode和equals方法

boolean contains(Object o)判断集合中是否有指定的对象，同样需要hashCode和equals方法

void clear()清空集合中的所有元素

int size()获取集合中的元素个数

HashSet的特征

无序：不仅不能保证元素插入的顺序（如果需要顺序则可以使用LinkedHashSet），而且在元素在以后的顺序中也可能变化（这是由HashSet按HashCode存储对象（元素）决定的，对象变化则可能导致HashCode变化）

三、LinkedHashSet

类定义，继承于HashSet，可克隆，可序列化

public class LinkedHashSet<E>
    extends HashSet<E>
    implements Set<E>, Cloneable, java.io.Serializable {

没有什么新方法，仅仅只是在HashSet的基础上添加了一个链表结构记录存取的顺序

LinkedHashSet是HashSet的一个子类，LinkedHashSet也根据HashCode的值来决定元素的存储位置，但同时它还用一个链表来维护元素的插入顺序，插入的时候即要计算hashCode又要维护链表，而遍历的时候只需要按链表来访问元素

四、TreeSet

TreeSet实现了SortedSet接口，顾名思义这是一种排序的Set集合

public class TreeSet<E> extends AbstractSet<E>
    implements NavigableSet<E>, Cloneable, java.io.Serializable
{

数据存储采用的是

private transient NavigableMap<E,Object> m;
//map中以key为需要存放的数据，以PERSENT常量为值存放数据
private static final Object PRESENT = new Object();

TreeSet底层是用TreeMap实现的，本质上是一个红黑树原理。正因为它是排序了的，所以相对HashSet来说，TreeSet提供了一些额外的按排序位置访问元素的方法，例如first(), last(), lower(), higher(), subSet(), headSet(), tailSet()

TreeSet的排序

排序分为两种：一种是自然排序，另一种是定制排序。

因为添加到TreeSet中要求对象必须是可比较的，要求添加到TreeSet中的元素类型必须实现Comparable接口

如果使用TreeSet时不会依靠hashcode和equals进行比较，相等性判断是依靠compareTo实现的

自然排序（在元素中写排序规则）
TreeSet 会调用compareTo方法比较元素大小，然后按升序排序（从小到达）。所以自然排序中的元素对象，都必须实现了Comparable接口，否则会抛出异常。对于TreeSet判断元素是否重复的标准，也是调用元素从Comparable接口继承而来compareTo方法，如果返回0则是重复元素。Java的常见类都已经实现了Comparable接口

五、哈希表及二叉树

哈希表

Hash一般翻译为“散列”，也有直接音译为“哈希”的，这就是把任意长度的输入通过散列算法，变换成固定长度的输出，该输出就是散列值（哈希值）；这种转换是一种压缩映射，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，所以不可能从散列值来唯一的确定输入值。

所有散列函数都有如下一个基本特性：根据同一散列函数计算出的散列值如果不同，那么输入值肯定也不同。但是，根据同一散列函数计算出的散列值如果相同，输入值不一定相同。

哈希冲突
当两个不同的输入值，根据同一散列函数计算出相同的散列值的现象，就把它叫做碰撞（哈希碰撞）。

散列算法
散列法Hashing是一种将字符组成的字符串转换为固定长度（一般是更短长度）的数值或索引值的方法，称为散列法，也叫哈希法。
由于通过更短的哈希值比用原始值进行数据库搜索更快，这种方法一般用来在数据库中建立索引并进行搜索，同时还用在各种解密算法中

二叉树

二叉搜索树（Binary Search Tree，简称 BST），BST是一种很常用的的二叉树。它的定义是：一个二叉树中，任意节点的值要大于等于左子树所有节点的值，且要小于等于右边子树的所有节点的值

主要针对链表的插入和删除很快，但是是查找数据却很慢的特点。树状结构最大的优势在于查找，但是插入和删除的效率都不太高

二叉树的特点：
左子树上所有结点的值均小于或等于它的根结点的值
右子树上所有结点的值均大于或等于它的根结点的值
左、右子树也分别为二叉排序树

三种遍历方式：

中序遍历:左子树——》根节点——》右子树
前序遍历:根节点——》左子树——》右子树
后序遍历:左子树——》右子树——》根节点

中序遍历 1 2 3 4 5 6 7
前序遍历 5 2 1 4 3 6 7
后序遍历 1 3 4 2 7 6 5

二叉树在极端情况下会退化为链表结构，为了避免出现这个问题，引入平衡树

AVL 树是一种平衡二叉树，平衡二叉树递归定义如下：
左右子树的高度差小于等于1。
其每一个子树均为平衡二叉树。

AVL树引入了所谓监督机制，就是在树的某一部分的不平衡度超过一个阈值后触发相应的平衡操作。保证树的平衡度在可以接受的范围内。

红黑树：

红黑树是一种近似平衡的二叉查找树，查找、删除、插入都快，树经常需要进行旋转达到平衡

红黑树特征：

1、每个节点不是红色就是黑色的；
2、根节点总是黑色的；
3、如果节点是红色的，则它的子节点必须是黑色的（反之不一定）,(也就是从每个叶子到根的所有路径上不能有两个连续的红色节点)；
4、从根节点到叶节点或空子节点的每条路径，必须包含相同数目的黑色节点（即相同的黑色高度）

各种Set集合性能分析

HashSet和TreeSet是Set集合中用得最多的集合。HashSet总是比TreeSet集合性能好，因为HashSet不需要额维护元素的顺序。
LinkedHashSet需要用额外的链表维护元素的插入顺序，因此在插入时性能比HashSet低，但在迭代访问（遍历）时性能更高。因为插入的时候即要计算hashCode又要维护链表，而遍历的时候只需要按链表来访问元素。
EnumSet元素是所有Set元素中性能最好的，但是它只能保存枚举类型的元素。

六、相关的集合计算

addAll将指定集合中的所有元素都添加到此集合中，如果在进行此操作的同时修改了指定的集合，那么将不能保证操作的正确性
removeAll从指定的集合中移除包含在另一个集合中的元素，返回值为boolean，如果包含了要移除的对象则返回true否则false
retainAll仅仅保留集合中同时包含在指定集合的对象，其它的全部移除
containsAll用来查看在该集合中是否存在在指定集合中的所有对象，返回true表示存在，否则false

Collection和Collections的区别

Collection是java.util下的接口，它是各种集合的父接口，继承于它的接口主要有Set 和List
Collections是个java.util下的类，是针对集合的帮助类，提供一系列静态方法实现对各种集合的搜索、排序、线程安全化等操作

//对集合进行自然序排序
 public static <T> void sort(List<T> list, Comparator<? super T> c) {
        list.sort(c);
    }

利用折半查找法查找元素

public static <T>
    int binarySearch(List<? extends Comparable<? super T>> list, T key) {
        if (list instanceof RandomAccess || list.size()<BINARYSEARCH_THRESHOLD)
            return Collections.indexedBinarySearch(list, key);
        else
            return Collections.iteratorBinarySearch(list, key);
    }