Java实现数据结构哈希表

哈希表

概述

给美分数据分配一个编号,放入表格(数组)

建立编号与表格索引的关系,将来就可以通过编号快速查找数据

  1. 理想情况编号当唯一,数组能容纳所有数据
  2. 现实是不能说为了容纳所有数据造一个超大数组,编号也可能重复

解决

  1. 有限长度的数组,以[拉链]方式存储数据
  2. 允许编号适当重复,通过数据自身来进行区分

代码

基础代码

public class HahTable {
    //节点类
    static class Entry{
        int hash;   //哈希码
        Object key; //键
        Object value;   //值
        Entry next;

        public Entry(int hash, Object key, Object value) {
            this.hash = hash;
            this.key = key;
            this.value = value;
        }
    }
    //创建一个数组,数组里面装的是Entry节点,也就是链表的头节点
    Entry[] table = new Entry[16];
    int size = 0;   //元素个数
}

获取

这里实际上可以使用取余运算,如果key值是9,8对数组的长度进行求余数,可以得出来是0,所以可以在数组0的那根链表上继续进行查找

可以看出索引3位置处就没有元素,返回的就是null

//根据hash码获取value
    private Object get(int hash,Object key){
        //hash码与数组的长度减一,实际上取到的就是索引值
        int index = hash & (table.length - 1);
        //如果数组的该索引位置处没有值的话,也不会有对应的value值,所以可以直接返回
        if(table[index] == null){
            return null;
        }
        //将table数组处index索引位置处的链表找到
        Entry p = table[index];
        //遍历链表
        while (p != null){
            //如果链表的key和传过来的key值相等的话可以直接将key值当值节点返回
            if(p.key.equals(key)){
                return p;
            }
            p = p.next;
        }
        //找到最后都没有的话,返回null值
        return null;
    }

插入

插入实际上也是,索引3位置处并没有内容,所以可以直接插入,而其他索引位置处就需要找到链表进行对应的位置插入了

 //向hash表存入新的key,value,如果key重复,则更新value
    private void put(int hash,Object key,Object value){
        //hash码与数组的长度减一,实际上取到的就是索引值
        int index = hash & (table.length - 1);
        //接下来会有两种情况
        //第一种:index索引位置处有空位置,直接新增
        if(table[index] == null){
           table[index] = new Entry(hash,key,value);
        }else{
            //第二种:index索引位置处没有空位,沿着链表查找,有key值的话,更新,没有的话新增
            Entry p = table[index];
            //遍历链表
            while (true){
                //如果链表的key和传过来的key值相等的话可以直接将key值当值节点返回
                if(p.key.equals(key)){
                    p.value = value;
                    return;
                }
                if(p.next == null){
                    break;
                }
                p = p.next;
            }
            //此时的p就是最后一个节点
            p.next = new Entry(hash,key,value);
        }
        size++;
    }

删除

//根据hash码删除,返回删除的value
    private Object remove(int hash,Object key){
        //hash码与数组的长度减一,实际上取到的就是索引值
        int index = hash & (table.length - 1);
        //如果数组的index位置处为null,直接返回null
        if(table[index] == null){
            return null;
        }
        //找到数组索引位置处的链表
        Entry p = table[index];
        Entry prev = null;//设置删除节点的父节点
        while (p != null){
            if(p.key.equals(key)){
                //找到了删除节点
                //如果删除的是头节点的话,将数组索引位置处的元素设置为链表头节点的下一个元素
                if(prev == null){
                    table[index] = p.next;
                }else{
                    //如果不是的话,将父节点的next指向儿子节点的next,这样就把儿子节点忽略掉了
                    prev.next = p.next;
                }
                return p.value;
            }
            prev = p;   //将当前节点设置称为删除节点的父节点
            p = p.next;
        }
        return null;
    }

此时会出现一个问题,就是如果说元素内容并不多,但是数组长度会很长则造成了空间的浪费,如果说数组长度不长,但是元素足够多就会导致增删改查的效率变低,所以需要在合适的时候对数组进行扩容,这里就引出了一个新的名词负载因子

扩容

负载因子公式如下图所示

  • 从上面可以看出n代表的是元素的个数,m代表的是数组的长度,他们的比值最好在4分之3左右
  • 扩容之后一般采取的办法是容量进行翻倍

 float loadFactor = 0.75f;//负载因子大小  12称为阈值
    int threshold =(int) (loadFactor * table.length);//这个实际上计算的实际上就是阈值

//向hash表存入新的key,value,如果key重复,则更新value
    private void put(int hash,Object key,Object value){
        //hash码与数组的长度减一,实际上取到的就是索引值
        int index = hash & (table.length - 1);
        //接下来会有两种情况
        //第一种:index索引位置处有空位置,直接新增
        if(table[index] == null){
           table[index] = new Entry(hash,key,value);
        }else{
            //第二种:index索引位置处没有空位,沿着链表查找,有key值的话,更新,没有的话新增
            Entry p = table[index];
            //遍历链表
            while (true){
                //如果链表的key和传过来的key值相等的话可以直接将key值当值节点返回
                if(p.key.equals(key)){
                    p.value = value;
                    return;
                }
                if(p.next == null){
                    break;
                }
                p = p.next;
            }
            //此时的p就是最后一个节点
            p.next = new Entry(hash,key,value);
        }
        size++;
        if(size > threshold){
            resize();
        }
    }

    /**
     * 扩容方法
     */
    private void resize() {
        Entry[] newTable = new Entry[table.length << 1];    //移位比直接乘以2效率更高
        for (int i = 0; i < table.length; i++) {
            Entry p = table[i];
            if(p != null){
                //拆分链表,移动到新的数组

                /*
                   拆分规律
                   * 一个链表最多拆成两个
                   * hash & table.length == 0 的一组
                   * hash & table.length != 1 的一组
                 */
            }
        }
        table = newTable;//扩容完成之后将新数组赋值给旧数组
        threshold = threshold =(int) (loadFactor * table.length);
    }

讲到这里就需要科普一个知识了
0 (二进制: 0000) & (按位与) 8 (二进制: 1000)   结果0

8 (二进制: 1000) & (按位与) 8 (二进制: 1000)    结果8

16 (二进制: 10000) & (按位与) 8 (二进制: 1000)  结果0

24 (二进制: 11000) & (按位与) 8 (二进制: 01000)  结果8

可以看出如果最后四位的值相等的时候结果为8,否则结果为0

 /**
     * 扩容方法
     */
    private void resize() {
        // 创建新的Entry数组,长度为原数组的两倍(通过位运算效率更高)
        Entry[] newTable = new Entry[table.length << 1];

        // 遍历原数组
        for (int i = 0; i < table.length; i++) {
            Entry p = table[i];

            // 如果当前位置有链表
            if(p != null){
                // 拆分链表,移动到新的数组
            /*
               拆分规律
               * 一个链表最多拆成两个
               * hash & table.length == 0 的一组
               * hash & table.length != 1 的一组
             */

                // 创建两个新的链表,一个是a,另一个是b
                Entry a = null;
                Entry b = null;
                Entry aHead = null;
                Entry bHead = null;

                // 递归遍历链表
                while (p != null){
                    // 如果当前节点的hash与数组的长度 == 0的时候添加到a,否则添加到b
                    if((p.hash & table.length) == 0){
                        if(a != null){
                            a.next = p;
                        }else{
                            aHead = p;
                        }
                        // 分配到a
                        a = p;
                    }else{
                        if(b != null){
                            b.next = p;
                        }else{
                            bHead = p;
                        }
                        // 分配到b
                        b = p;
                    }
                    // 进行递归遍历
                    p = p.next;
                }

                // 将链表a添加到新数组的原位置
                if(a != null ){
                    a.next = null;
                    newTable[i] = aHead;
                }

                // 将链表b添加到新数组的原位置的后半部分
                if(b != null ){
                    b.next = null;
                    newTable[i + table.length] = bHead;
                }
            }
        }

        // 扩容完成之后将新数组赋值给旧数组
        table = newTable;

        // 更新阈值
        threshold = (int) (loadFactor * table.length);
    }

哈希算法

概述

hash算法是将任意对象,分配一个编号的过程,其中编号是一个有限范围内的数字(如int范围内),hash算法是一种将任意长度的数据通过一个算法,变成固定长度数据的过程,这个固定长度的数据就是hash值。hash算法可以将任意大小的数据压缩到固定大小的值。常见的hash算法有MD5、SHA1、SHA256、SHA512、CRC32等。其中,MD5和SHA系列算法是最常用的hash算法。这些算法在计算hash值时,都考虑了原始数据的每一个字节,一旦改动原始数据的任何一个字节,所得到的hash值都会有明显的不同。因此,hash算法被广泛应用于数据完整性校验和加密等方面。

在java里面可以调用对象的HashCode方法来进行获取

字符串生成hash的方法

public static void main(String[] args) {
        String str = "abc";
        System.out.println(str.hashCode());

        System.out.println("==================");
        int hash = 0;
        for (int i = 0; i < str.length(); i++) {
            char c = str.charAt(i);
            hash = hash * 31 +c;
        }
        System.out.println(hash);

    }

  • 36
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值