数据结构和算法之哈希表(散列)的介绍和内存布局

最新推荐文章于 2023-03-18 22:14:54 发布

一直奋斗的小猿

最新推荐文章于 2023-03-18 22:14:54 发布

阅读量1.1k

点赞数 1

分类专栏：数据结构和算法

本文链接：https://blog.csdn.net/one111a/article/details/100063467

版权

数据结构和算法专栏收录该内容

34 篇文章 0 订阅

订阅专栏

散列表的基本介绍

散列表(Hash table,也叫哈希表)，是根据关键码值(key value)而直接进行访问的数据结构。也就是

说，它通过把关键码值映射到表中一个位置来访问记录，以加快查找的速度。这个映射函数叫做散列

函数，存放记录的数据叫做散列表。

在写了一段java程序，java程序要去操作数据库，然后数据库经过一番操作将结果返回给java程序，

java程序拿到结果进行显示，数据一般是放在数据库的，但是这种结构有一个问题，它会对我们的数

据库的操作可能非常频繁，有些数据没必要每次都去查数据库，在某些情况下不需要，那在这种情况

下我们会加一个缓存层。一般来讲，我们提高我们的检索速度，一般就是把我们常用的数据加载到缓

存层，我们能够在缓存层取数据就不到数据库取数据，那么缓存层我们一般使用相关的缓存产品。

缓存产品：Redis Memcache

那我们除了缓存产品以外，也可以自己写一个缓存层，这个时候就要借助于数据结构哈希表来做。哈

希表从某个角度来说，它就是可以先把数据先加载到内存，加载到内存，把它放入到哈希表中，这样

再取数据的时候就无须在到数据库取，什么时候才到数据库取呢，如果在某些情况下使用缓存产品太

重量级了就可以自己写个哈希表，这个时候我们可以事先把数据先放到哈希表中，然后我们取数据的

时候先到哈希表中取，这样就可以提高我们的效率。

那么哈希表的结构有哪些呢？

比如说我们常用的有：

数组+链表
数组+二叉树(如果我们用的是二叉排序树，性能就能有所提升)

不管是数组配合链表还是数组配合二叉树，其主要目的都是去提升我们数据的查找速度，为什么这么

做呢？因为如果我们每次都是直接查数据库，速度太慢了，而且对数据库压力太大，所以我们先把数

据放入哈希表，我程序先到哈希表去取，取不到再到数据库去取，然后把经常用的在加载到哈希表里

面就可以了，这样就提升了我们的速度。那如果一级缓存不够，我们可以再加一个缓存层，这样就形

成二级缓存了，二级缓存可以通过再哈希得到。这就是哈希表的由来。

在这里插入图片描述

那么哈希表在内存布局中的结构是怎么样的呢？下面这张图清晰的反映了它的结构：
在这里插入图片描述

从上图可以看出，这是一张表，也可以看成是一个数组，那这个数组它放的不再是普通数据，而是一

个链表，也就是说这个数组变成了链表数组，当我们去查找一个id的时候，我们可以先用散列函数来

得到我们这个信息会在这个表里面的哪一条链表，这样就直接在这条链表里面去查，从而提高速度。

打个比方，比如现在有15条链表，我们来一个值 111 % 15 ，我们就知道111 id号在哪条链表，我们

直接到这条链表去取，相当于说速度就提升了15倍。这样比我们单独使用链表要快，那整个数组+链

表就形成了一个所谓的散列表，也叫哈希表，这就是哈希表一个最基本的工作原理，也是它的内存布

局图。

实际需求：google公司的一个上机题

有一个公司，当有新的员工来报到时，要求将该员工的信息加入(id，性别，年龄，名字，住址…)当

输入该员工的id时，要求查找到该员工的所有信息

要求：不使用数据库，尽量节省内存，速度越快越好=>哈希表(散列)

添加时，保证按照id从低到高插入(思考：如果id不是从低到高插入，但要求各条链表仍是从低到高，

怎么解决？)

(1) 使用链表来实现哈希表，该链表不带表头[即：链表的第一个节点就存放雇员信息]

(2) 思路分析并画出示意图

(3) 代码实现[增删改查(显示所有员工，按id查询)]
在这里插入图片描述

代码实现：

import java.util.Scanner;

public class HashTableDemo {
    public static void main(String[] args) {

        // 创建哈希表
        HashTable hashTab = new HashTable(7);

        // 写一个简单的菜单
        String key = "";
        Scanner scanner = new Scanner(System.in);
        while(true){
            System.out.println("add:    添加雇员");
            System.out.println("list:   显示雇员");
            System.out.println("find:   查找雇员");
            System.out.println("exit:   退出系统");

            key = scanner.next();
            switch (key){
                case "add":
                    System.out.println("输入id");
                    int id = scanner.nextInt();
                    System.out.println("输入名字");
                    String name = scanner.next();
                    // 创建雇员
                    Emp emp = new Emp(id, name);
                    hashTab.add(emp);
                    break;
                case "list":
                    hashTab.list();
                    break;
                case "find":
                    System.out.println("请输入要查找的id");
                    id = scanner.nextInt();
                    hashTab.findEmpById(id);
                    break;
                case "exit":
                    scanner.close();
                    System.exit(0);
                default:
                    break;
            }
        }
    }
}

//创建HashTable 管理多条链表
class HashTable {
    private EmpLinkedList[] empLinkedListArray;
    private int size;  // 表示有多少条链表
    // 构造器
    public HashTable(int size){
        this.size = size;
        // 初始化EmplinkedListArray
        empLinkedListArray = new EmpLinkedList[size];
        // 这时需要分别初始化每个链表
        for (int i = 0; i < size; i++){
            empLinkedListArray[i] = new EmpLinkedList();
        }

    }
    // 添加雇员
    public void add(Emp emp){
        // 根据员工的id, 得到该员工应当添加哪条链表
        int empLinkedListNO = hashFun(emp.id);
        // 将emp添加到对应的链表中
        empLinkedListArray[empLinkedListNO].add(emp);

    }
    // 遍历所有的链表，遍历hashTab
    public void list(){
        for (int i = 0; i < size; i++){
            empLinkedListArray[i].list(i);
        }
    }

    // 根据输入的id，查找雇员
    public void findEmpById(int id){
        // 使用散列函数确定哪条链表查找
        int empLinkedListNO = hashFun(id);
        Emp emp = empLinkedListArray[empLinkedListNO].findEmpById(id);
        if (emp != null){ // 找到
            System.out.printf("在第%d条链表中找到 雇员id = %d\n", (empLinkedListNO + 1), id);
        }else{
            System.out.println("在哈希表中，没有找到该雇员");
        }
    }
    // 编写散列函数，使用一个简单取模法
    public int  hashFun(int id){
        return id % size;
    }
}


// 表示一个雇员
class Emp{
    public int id;
    public String name;
    public Emp next; //next 默认为 null

    public Emp(int id, String name) {
        this.id = id;
        this.name = name;
    }
}

// 创建EmpLinkedList, 表示链表
class EmpLinkedList {
    // 头指针，执行第一个Emp，因此我们这个链表的head是直接指向第一个Emp
    private Emp head;  // 默认null

    // 添加雇员到链表
    // 说明
    // 1、指定，当添加雇员时， id是自增长，即id的分配总是从小到大
    // 因此我们将该雇员直接加入到本链表的最后即可
    public void add(Emp emp){
        //如果是添加第一个雇员
        if(head == null){
            head = emp;
            return;
        }
        // 如果不是第一个雇员，则使用一个辅助的指针，帮助定位到最后
        Emp curEmp = head;
        while(true){
            if (curEmp.next == null){ // 说明到链表最后
                break;
            }
            curEmp = curEmp.next;  // 后移
        }
        // 退出时直接将emp 加入链表
        curEmp.next = emp;
    }
    // 遍历链表的雇员信息
    public void list(int no){
        if (head == null){  // 说明链表为空
            System.out.println("第 "+(no+1)+" 链表为空");
            return;
        }
        System.out.println("第 "+(no+1)+" 链表的信息为");
        Emp curEmp = head;  // 辅助指针
        while(true){
            System.out.printf(" => id=%d name=%s\t", curEmp.id, curEmp.name);
            if (curEmp.next == null){  // 说明curEmp已经是最后结点
                break;
            }
            curEmp = curEmp.next;  // 后移，遍历
        }
        System.out.println();
    }
    // 根据id查找雇员
    // 如果查找到，就返回Emp, 如果没找到，就返回null
    public Emp findEmpById(int id){
        // 判断链表是否为空
        if (head == null){
            System.out.println("链表为空");
            return null;
        }
        // 辅助指针
        Emp curEmp = head;
        while(true){
            if (curEmp.id == id){  // 找到
                break;  // 这时curEmp就指向要查找的雇员
            }
            // 退出
            if (curEmp.next == null){ // 说明遍历当前链表没有找到该雇员
                curEmp = null;
                break;
            }
            curEmp = curEmp.next;  // 后移
        }
        return curEmp;
    }
}

一直奋斗的小猿

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据结构和算法之哈希表(散列)的介绍和内存布局

散列表的基本介绍散列表(Hash table,也叫哈希表)，是根据关键码值(key value)而直接进行访问的数据结构。也就是说，它通过把关键码值映射到表中一个位置来访问记录，以加快查找的速度。这个映射函数叫做散列函数，存放记录的数据叫做散列表。在写了一段java程序，java程序要去操作数据库，然后数据库经过一番操作将结果返回给java程序，java程序拿到结果进行显示，数据一般是放...
复制链接

扫一扫