1 介绍
散列表(Hash table,也叫哈希表),根据关键码值(Key value)而直接进行访问的数据结构。 它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。 这个映射函数叫做散列函数,存放记录的数组叫做散列表。
2 分析
哈希冲突:哈希表关键码值key是通过哈希函数计算得到一个值,这个key反映的是在数组上的位置,当key值相同的时候就是哈希冲突。
处理哈希冲突的方式:
- 开放寻址法:如果位置被占了,那就另外再找个位置。最基本的方法就是查看该位置的后一个位置是否可用,如果没有被占用,那就放到这里,如果被占用,那就继续往下找,以此类推,直到找到空位置。
- 链地址法(拉链法):把key值相同的放在一个链表上
- 再哈希法:在发生冲突的时候再用另外一个哈希函数算出哈希值,直到算出的哈希值不同为止。
- 建立公共溢出区: 将哈希表分为基本表和溢出表两部分,凡是和基本表发生冲突的元素,一律填入溢出表。
哈希函数(核心):用于计算关键码值Key的。一个好的哈希函数可以极大的提升性能,能极大的减少哈希冲突。常见方法有直接定址法,数字分析法,折叠法,随机数法和除留余数法等等。
哈希表的底层实现两种简单的方式:
- 数组+链表
- 数组+二叉树
3 代码实现
package com.czq.datastructure;
import java.util.Scanner;
/**
* 哈希表:数组+链表
*
* @author czq
* @date 2020/08/18
*/
public class HashTab {
public static void main(String[] args) {
// 创建哈希表
HashTable hashTab = new HashTable(7);
// 菜单
String key = "";
Scanner scanner = new Scanner(System.in);
while (true) {
System.out.println("add: 添加员工");
System.out.println("list: 显示员工");
System.out.println("find: 查找员工");
System.out.println("exit: 退出系统");
key = scanner.next();
switch (key) {
case "add":
System.out.println("输入id");
int id = scanner.nextInt();
System.out.println("输入名字");
String name = scanner.next();
// 创建员工
Emp emp = new Emp(id, name);
hashTab.add(emp);
break;
case "list":
hashTab.list();
break;
case "find":
System.out.println("请输入要查找的id");
id = scanner.nextInt();
hashTab.findEmpById(id);
break;
case "exit":
scanner.close();
System.exit(0);
default:
break;
}
}
}
}
// hashTab 哈希表,管理链表
class HashTable {
private EmpLinkedList[] empLinkedListArray;
private int size;// 链表条数
public HashTable(int size) {
this.size = size;
// 初始化 hashTab,不仅仅初始化 hashTab ,以及存放的 linkedList也需要初始化
empLinkedListArray = new EmpLinkedList[size];
for (int i = 0; i < empLinkedListArray.length; i++) {
empLinkedListArray[i] = new EmpLinkedList();
}
}
// 散列函数(使用简单的取模法)
public int hashCodeLow(int id) {
return id % size;
}
// 添加
public void add(Emp emp) {
// 获取员工的id,根据id决定应当添加到哪条链表
int empLinkedListNo = hashCodeLow(emp.id);
// 将 emp 添加到对应的链表中
empLinkedListArray[empLinkedListNo].add(emp);
}
// 遍历 HashTable,遍历所有链表
public void list() {
for (int i = 0; i < size; i++) {
empLinkedListArray[i].list(i);
}
}
// 根据输入的 id ,查找员工
public void findEmpById(int id) {
// 使用散列函数值,确定在哪条链表进行查找
int empLinkedListNo = hashCodeLow(id);
Emp emp = empLinkedListArray[empLinkedListNo].findEmpById(id);
if (emp != null) {
System.out.printf("在第%d条链表中找到 店员 id = %d\n", (empLinkedListNo + 1), id);
} else {
System.out.println("在哈希表中,没有找到该店员~");
}
}
}
// 链表
class EmpLinkedList {
// 头节点,直接指向第一个 emp,默认null
private Emp head;
// 添加:若添加员工时,id从小到大自增大,因此将员工直接插入到链表最后即可
public void add(Emp emp) {
if (head == null) {
head = emp;
return;
}
Emp curEmp = head;
while (curEmp.next != null) {
curEmp = curEmp.next;// 后移
}
// 退出时,直接将 emp 插入到链表中
curEmp.next = emp;
}
// 遍历
public void list(int no) {
if (head == null) {
System.out.println("第" + (no + 1) + "个链表为空");
return;
}
System.out.println("第" + (no + 1) + "个链表的信息如下:");
// 用于遍历的辅助指针
Emp curEmp = head;
while (true) {
System.out.printf(" => id=%d name=%s\t", curEmp.id, curEmp.name);
if (curEmp.next == null) {
// 已经到最后一个节点
break;
}
curEmp = curEmp.next;// 后移
}
System.out.println();
}
// 根据id查找的员工
public Emp findEmpById(int no) {
if (head == null) {
System.out.println("空链表,您查找的链表为空");
return null;
}
Emp temp = head;
while (true) {
if (temp.id == no) {
break;
}
if (temp.next == null) {
// 既没找到,最终要返回的就是 null
temp = null;
break;
}
temp = temp.next;// 后移
}
return temp;
}
}
// 表示一个员工
class Emp {
public int id;
public String name;
public Emp next;// 默认 null
public Emp(int id, String name) {
super();
this.id = id;
this.name = name;
}
}