Map和set (2)

思考 :

1.对于任何一颗BST,最小值一定是叶子结点吗?

不一定是叶子结点,不断向左树递归查找,找到的第一个左子树为空的结点一定是当前BST的最小值。

2.BST中最大值一定位于右树的最右侧

我们不断递归地向右树查找,找到的第一个node.right== null 的结点就是最大值。

Hibber Deletion:在BST中删除一个左右子树都存在的结点,找到当前以58为根节点的前驱或者后继节点作为删除的新结点。

前驱:在以58为根的BST中最后一个小于58的结点(小于58的结点中最大的一个)53

后继:在以58为根的BST中第一个大于58的结点(大于58的节点中最小的一个)59


    //在BST中删除任意值
    public void remove(int val){
        root = remove(root,val);
    }

    private TreeNode remove(TreeNode root, int val) {
        //在当前root为根节点的BST中删除值为val的结点
        //返回删除后的新的根节点
        //边界条件
        if(root == null){
            //把树中所有节点都遍历完还没找到值为val的结点,就不存在值为val的结点
            throw new NoSuchElementException("BST 中没有值为" +val +"的结点");
        }else if(val <root.val){
            //此时应在左子树中找
            root.left = remove(root.left,val);
            return root;
        }else if(val >root.val){
            //此时在右树中找
            root.right = remove(root.right,val);
            return root;
        }else{
            //此时root.val == val
            //root是待删除的结点
            if(root.left == null){
                //只有右孩子,返回右孩子
                TreeNode right = root.right;
                root.right = root =null;
                size --;
                return right;
            }
            if(root.right == null){
                //此时右树为空,只有左孩子
                TreeNode left = root.left;
                root.left = root = null;//断开两根线
                size --;
                return left;
            }
            //此时说明root.left和root.right都不为空
            //Hibber Deletion
            TreeNode successor = minNode(root.right);//在比val大的节点中找出最小的一个
            successor.right = removeMin(root.right);
            //然后删除这个后继结点,将找出的后继结点的右子树作为新的结点
            successor.left = root.left;
            root.right = root.left = root = null;//断开两根线
            return successor;
        }
    }

为啥最后没有size --?

在右子树中删除后继结点的时候就已经size--了。


BST是非常高效的查询数据结构,但是BST也会在某些场景下出现退化的情况

eg.向BST中插入1 2 3 4 5 6 7 8 9

 此时BST就退化为链表(单支树),查询效率就会退化为O(N).

为了避免在数据插入时,BST左右子树高度严重倾斜,引入了平衡树:

AVL:严格平衡,任意一个子树左右高度差不超过1BST永远不会退化为链表,性能保证是O(logN)

RBTree:黑结点严格平衡

这两个都是二分平衡搜索树。


哈希表实际上是通过数组衍生出来的,哈希表高效查找的奥秘就在于数组的随机访问特性。

哈希表是一个典型的以空间换时间的数据结构

1.遍历原集合,创建一个新数组,建立元素和索引的对应关系,当元素在集合中存在,我就讲新数组对应的索引的位置标记为true

2.判断一个数是否在原集合存在,只需要拿着这个数对应在新数组的索引位置是否为true,就能查询到是否存在。o(1)

所谓的哈希函数就是将任意的数据类型变为整型int后就可以作为数组的索引了。

假设现在的数据集是[1000,0,3000,10,-2,10000]这种跨度大的元素集合,有的元素本身值比较大,若采用一一对应的方式的话就得开辟长度至少100001的长度,非常浪费空间。

因此大部分场景下,我们需要将原数组的元素和数据的索引位置建立一个映射关系 (哈希函数)

最常用的哈希方法“取模”

1.先将key取绝对值,对任意整数x & 0x7fffffff ,就是x取绝对值

2.将绝对值%10(区间的大小取决于我们取模数的大小)

有可能出现多个不同的key经过hash之后得到了相同的值,哈希冲突

哈希函数的设计原则:

1.不同的key值经过hash函数运算后得到的结果分布越均匀越好

一般模一个素数会得到一个比较均衡的值

2.稳定性:相同的key值经过N次哈希运算得到的值一定是相同的

哈希函数一般不需要我们自己设计,用现成的即可hashCode()

任意一个数据类型都可以通过hashCode方法转为整形

public class HashTest {
    public static void main(String[] args) {
        String str = "门门";
        Integer age = 18;
        Double c = 79.5;//这是一个包装类
        System.out.println(str.hashCode());
        System.out.println(age.hashCode());//必须要使用包装类才可以使用hashCode,
                              //如果使用的是int,就不能解析出hashCode
        System.out.println(c.hashCode());
    }
}

hashCode相同的对象equals一定相同吗?false

不同的key对应了相同的hash

equals相同的对象hashCode的值一定相同吗?true

以MD5为例,MD5一般给字符串进行hash运算

MD5的三大特点:

1.定长,无论输入的数据有多长,得到的MD5值得长度是固定的

2.分散,如果输入的数据稍微有点变化,得到的MD5值相差非常大

3.不可逆,根据任意值计算出的MD5值很容易,但是MD5值还原为原数据(难如登天),基本不可能(用在加密领域)

 MD5的应用:

1.作为hash值

2.作为加密

3.对比文件内容

一般来说大文件都会有一个MD5值,大文件在传输过程中有可能由于网络问题有的片段丢失了,要想知道下载后的文件内容是正确的,我们就拿着下载后的文件计算md5值,看下载的和原文件的MD5值是否相同。


面试重点:

ConcurrentHashMap、HashMap合在一起来面试

1.动态搜索使用的数据结果

哈希表   VS    搜索树实现(规则复杂 -> 要做到线程安全比较困难)

2.HashMap是java中实现的哈希表,解决冲突的方式是拉链法

3.HashMap的put过程是咋回事

     1.使用key,获取hash值得过程     int h = key.hashCode();

                                                        为了提升均匀度,做了高16位和低16位的异或

     2.使用hash值,得到合法下标的过程

          方法一:int index = h%array.length;

          方法二:int index = h & (array.length -1)   前提:array.length一定是2的n次方

    3.通过index,从数组中得到一条链表(可能是空链表)的头结点引用(可以是null)

    4.遍历这条链表,查看Key是否已经在链表的结点中  前提:hash设计的合理+扩容及时 ->足够均匀,这个链表的长度<8 

       循环+ equals(key)

     5.如果key存在,就是更新操作

      如果key不存在,就是更新操作(在链表)

     如果key不存在,就是新增操作(尾插、头插都可以)

    6.如果发生了插入,判断是否有必要进行扩容

4.HashMap是线程安全的吗?   不是

get(...)   只读操作,不需要太过于思考线程安全的问题

put(...)写操作,思考线程安全基于put操作思考

1.正确的使用标准上,永远不要在多线程环境下(有共享的)使用HashMap

但总是有很多低水平的程序员在多线程环境下使用了HashMap

结果就是错的。官方做了一些操作,链表插入的时候,选择了尾插,而不是头插

头插:在多线程环境下,头插可能把链表变成一个环 ->遍历链表变成死循环 ->使得map.get()和

          map.put()永远不可能返回了。

改为尾插:数据还是可能出错,但至少不会死循环了

2.如何把HashMap变成线程安全

 方法一:一把锁搞定

sync(put){}    sync(get){}   可以做到线程安全,但是性能比较差

方法二:

使用java.util.conCurrentHashMap(分段锁)

指针对某个链表做互斥,只要不是同一个链表,就不需要互斥了。

一旦扩容,就涉及所有链表了,针对某个链表做互斥就没有意义了。当前遭到扩容的线程,只负责扩容+搬一个元素,期间老数组和新数组同时存在。

扩容期间:把老数组中的每个key -value重新计算下标,放入新数组的指定链表中,某个线程t1搬一个元素,剩下的交给其他线程,一次参与。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值