哈希表
哈希表(Hash table)又称散列,它是根据关键码值(key value)而直接进行访问的数据结构,通过映射函数把关键码值映射到表中一个位置来访问记录,以加快查找速度。映射函数又称散列函数,存放记录的数组叫做散列表。
由于Java程序在很多情况下需要用到数据库里的数据,但是若要频繁操作数据库,直接操作数据库会比较麻烦,效率较低,因此,早期可以使用哈希表进行数据缓存,提高数据操作效率。一个简单的缓存层原理如下图:
哈希表的一个简单结构如下图。其用一个数组来存放数据,数组的每个元素是一条链表,构成哈希表。
为了说明哈希表的作用,下面举例说明。
要求:有一个公司,当有新的员工来报道时,要求将该员工的信息加入(id,性别,年龄),当输入该员工的 id 时, 要求查找到该员工的 所有信息。要求使用哈希表,添加时,保证按照 id从低到高插入,使用链表来实现哈希表, 该链表不带表头,即链表的第一个结点就存放雇员信息。
分析如下:由于需要员工信息,因此要创建雇员类,每个节点表示雇员信息,多个节点组成一个链表,每个链表存在在一个数组里,因此还需要链表类、以及哈希表类(数组里存放多条链表)。下面是一个分析图解。
代码实现的简要步骤:
(1)首先创建雇员类Emp,其定义员工的id、姓名,并给出雇员属性的下一个节点属性,方便对每条链表进行多个节点的创建。
(2)创建链表类EmpLinkedList,每个链表里有多个节点,可以存放多个雇员信息,创建Emp类的头指针,用来存放第一个雇员,后续编写添加雇员、查找雇员信息、以及遍历雇员信息的方法,利用一个辅助指针进行遍历、查找、添加即可,直到操作到链表的最后。
(3)创建哈希表HashTab,其是一个数组,存放多个EmpLinkedList信息,需要初始化确定数组的容量,如存放7条链表,按照容量构造一个数组即可,为了利用id号查找雇员信息,需要编写一个方法,即编写:散列函数,表示id与表中位置的映射关系。接着编写添加、遍历、查找等方法,调用EmpLinkedList类里的对应方法,即可通过哈希表实现对员工信息的增删改查,从而提高数据操作的效率。
下面给出代码实现:
public class HashTableDemo {
public static void main(String[] args) {
//创建哈希表
HashTab hashTab = new HashTab(7);
//写一个菜单
String key = "";
Scanner scanner = new Scanner(System.in);
while (true) {
System.out.println("请输入你的选择:");
System.out.println("add: 添加雇员");
System.out.println("find: 查找雇员");
System.out.println("list: 显示雇员");
System.out.println("exit: 退出系统");
key = scanner.next();
switch (key) {
case "add":
System.out.println("输入id");
int id = scanner.nextInt();
System.out.println("输入名字");
String name = scanner.next();
//创建雇员
Emp emp = new Emp(id, name);
hashTab.add(emp);
break;
case "list":
hashTab.list();
break;
case "find":
System.out.println("请输入要查找的id");
id = scanner.nextInt();
hashTab.findEmpById(id);
break;
case "exit":
scanner.close();
System.exit(0);
break;
default:
break;
}
}
}
}
//创建一个雇员
class Emp {
public int id;
public String name;
public Emp next;//默认空
public Emp(int id, String name) {
this.id = id;
this.name = name;
}
}
//创建链表
class EmpLinkedList {
//头指针,指向第一个Emp,就是说 链表的head 直接指向第一个Emp
private Emp head;//默认null
//添加雇员到链表
//说明:假定添加雇员时加在链表的最后 id是自增长,即id分配总是从小到大
// 因此将该雇员直接加入到本链表的最后一个即可
public void add(Emp emp) {
//如果是 添加第一个雇员
if(head == null) {
head = emp;
return;
}
//如果不是第一个雇员,则使用辅助指针,帮助定位到最后
Emp curEmp = head;
while (true) {
if(curEmp.next == null) {
break;
}
curEmp = curEmp.next;//后移,直到到最后
}
//退出时,直接将emp加入链表最后
curEmp.next = emp;
}
//遍历链表的雇员信息
public void list(int no) {//no 为编号
if(head == null) {//说明链表为空
System.out.println("第 " + (no + 1) + " 条链表为空");
return;
}
System.out.print("第 " + (no+1) + " 条链表的信息为:");
Emp curEmp = head;//辅助指针
while(true) {
System.out.printf("=> id=%d name=%s\t", curEmp.id, curEmp.name);
if(curEmp.next == null) {//说明到链表最后了
break;
}
curEmp = curEmp.next;//指向下一个,即 遍历
}
System.out.println();
}
//编写查找方法,根据id查找雇员
//如果找到,返回Emp,如果没有找到,返回null
public Emp findEmyById(int id) {
//判断链表是否为空
if(head == null) {
System.out.println("链表为空");
}
//不为空,辅助指针
Emp curEmp = head;
while (true) {
if(curEmp.id == id) { //找到
break;//curEmp就指向要查找的雇员
}
if(curEmp.next == null) {//遍历当前链表,但没有找到该雇员
curEmp = null;//置空
break;
}
curEmp = curEmp.next;//后移 继续判断
}
return curEmp;
}
}
//!!!!创建哈希表 hashTab 管理多条链表
class HashTab {
private EmpLinkedList[] empLinkedListArray;
private int size;//链表的个数
//构造器
public HashTab(int size) {
this.size = size;
//初始化 数组链表
empLinkedListArray = new EmpLinkedList[size];
//坑 不要忘了!初始化每个链表
for (int i =0; i < size; i++) {
empLinkedListArray[i] = new EmpLinkedList();//创建
}
}
//添加雇员
public void add(Emp emp) {
//根据员工的id,得到该员工应该添加到哪条链表 散列
int empLinkedNO = hashFun(emp.id);
//将emp添加到对应的链表中
empLinkedListArray[empLinkedNO].add(emp);
}
//遍历所有链表,即 遍历哈希表
public void list() {
for (int i = 0; i < size; i++) {
empLinkedListArray[i].list(i);
}
}
//查找
public void findEmpById(int id) {
//使用散列函数确定到哪条链表查找
int empLinkedNO = hashFun(id);
Emp emp = empLinkedListArray[empLinkedNO].findEmyById(id);
if(emp != null) {//找到
System.out.printf("在第 %d 条链表中找到雇员 id = %d\n", (empLinkedNO+1), id);
} else {
System.out.println("在哈希表中,没有找到该雇员");
}
}
//编写一个散列函数,使用取模法
public int hashFun(int id) {
return id % size;//取模法
}
}