从1开始学Java数据结构与算法——哈希表的内存布局与代码实现
需求引入
我们来看一个实际的需求:
有一个公司,当有新员工来报道的时候,要求将该员工的信息加入(id,姓名,年龄等),且当输入该员工的id时,要求查到该员工的所有信息
要求:不能使用数据库,尽量节省内存,速度越快越好
那么这个时候就可以使用我们的哈希表了,虽然java.util包里有提供哈希表的工具,但是下面我们还是自己分析,然后写一个,能让我们更了解哈希表这个东西,在以后运用它或者看java这些工具类的源码的时候,也更加轻松
哈希表的介绍与内存布局
散列表,也叫哈希表(HashTable),是根据关键码值而直接进行访问的一种数据结构。也就是说它通过把关键码值映射到表中的某一个位置来访问记录,以加快查找速度,而这个映射函数叫做散列函数,存放记录的数组叫散列表
哈希表的实现有两种方式:
1)数组+链表(本篇博客采用该种方式去实现,内存布局如下图)
2)数组+二叉树
从上图我们可以看出,通过散列函数的计算之后,在添加数据的时候,将数据分散开来,那么在之后我们就可以快速定位到要查找数据所在的链表,而不是像传统的将所有数据都放在一条链上,这样去遍历查找的效率自然是非常低的。
思路分析
那么根据上面对哈希表内存布局的描述,我们可以分析出,要自己实现一个哈希表,至少需要三个类:
1)节点类:里面存放职员的信息以及next域
2)链表类:表示每条独立的链表,里面需要有对该链表的增删改查等需求方法
3)数组类:这个其实也就是我们的哈希表类,将该类实例化,确定数组的大小之后,将链表类逐个实例化后放入该数组中,那么我们就可以通过散列函数的计算,确定对该数组中哪条链进行操作,接着再调用链表类里面的方法进行该链的具体操作即可
代码实现
下面代码针对博客最开始的需求,实现了用自己编写的哈希表进行对员工信息的增删改查的基本操作。(这里只是根据哈希表的内存布局简单实现了功能,并没有进行封装,所以和java工具类中的采用键值对的形式有所区别)
/**
* 职员节点类
*/
class Employee{
int id;//职员id
String name;//职员姓名
Employee next;//链表的next域
//构造器
public Employee(int id, String name) {
this.id = id;
this.name = name;
next = null;
}
}
/**
* 链表类
*/
class EmployeeLinkList{
private Employee head;//这里不需要头节点,直接指向第一个节点
//添加职员节点
public void add(Employee e) {
if(head == null) {
//直接加入到第一个节点
head = e;
return;
}
//如果该链表不为空,就需要遍历到最后一个位置去加入,那么这里就需要一个辅助变量去表示位置的后移
Employee curEmp = head;
while(true) {
if(curEmp.next == null) {
//说明到了最后一个节点
curEmp.next = e;//加入
break;
}
curEmp = curEmp.next;//辅助变量后移寻找链表末端
}
}
//遍历显示职员节点
public void list() {
if(head == null) {
//说明链表为空
System.out.println("该链为空,暂无数据");
return;
}
//如果不为空,同样的遍历显示,需要一个辅助变量
Employee curEmp = head;
while(true) {
System.out.printf("=>id=%d,name=%s",curEmp.id,curEmp.name);
if(curEmp.next == null) {
//说明已经到了最后一个节点
break;
}
//后移显示下一个节点信息
curEmp = curEmp.next;
}
System.out.println();
}
//根据员工id查找职员节点
public Employee find(int id) {
if(head == null) {
return null;
}
//如果不为空,同样的,用一个辅助变量去遍历查找到该节点
Employee curEmp = head;
while(true) {
if(curEmp.id == id) {
//找到了
break;
}
if(curEmp.next == null) {
//说明找到了最后一个节点都没找到,说明不存在
curEmp = null;
break;
}
//还没到最后一个节点,也没找到的话,就继续后移寻找
curEmp = curEmp.next;
}
return curEmp;
}
//根据id删除员工
public void delete(int id) {
if(head == null) {
System.out.printf("编号为%d的职员不存在\n",id);
return;
}
//如果不为空,同样的,用一个辅助变量去遍历查找到该节点
Employee curEmp = head;
if(curEmp.id == id) {
//如果要删除的是第一个节点的话,直接head后移
head = curEmp.next;
System.out.println("删除成功");
return;
}
while(true) {
if(curEmp.next == null) {
//说明找到了最后一个节点都没找到,说明不存在
System.out.printf("编号为%d的职员不存在\n",id);
break;
}
if(curEmp.next.id == id) {
//找到要删除的前一个节点,开始进行删除操作
curEmp.next = curEmp.next.next;
System.out.println("删除成功");
break;
}
//还没到最后一个节点,也没找到的话,就继续后移寻找
curEmp = curEmp.next;
}
}
//修改职员结点信息
public void update(Employee e) {
if(head == null) {
System.out.printf("编号为%d的职员不存在\n",e.id);
return;
}
//如果不为空,同样的,用一个辅助变量去遍历查找到该节点
Employee curEmp = head;
while(true) {
if(curEmp.id == e.id) {
//找到了,进行修改操作
curEmp.name = e.name;
System.out.println("修改成功");
break;
}
if(curEmp.next == null) {
//说明找到了最后一个节点都没找到,说明不存在
System.out.printf("编号为%d的职员不存在\n",e.id);
break;
}
//还没到最后一个节点,也没找到的话,就继续后移寻找
curEmp = curEmp.next;
}
}
}
/**
* 哈希表类
*/
class HashTable{
EmployeeLinkList EmployeeLinkListArray[];//存放多条链表的数组
int size;//数组的大小
//构造器
public HashTable(int size) {
this.size = size;
EmployeeLinkListArray = new EmployeeLinkList[size];
for(int i = 0; i < size; i++) {
EmployeeLinkListArray[i] = new EmployeeLinkList();
}
}
//添加方法
public void add(Employee e) {
int group = getGroup(e.id);//先确定散列到哪条链表上
EmployeeLinkListArray[group].add(e);
}
//遍历显示
public void list() {
//循环每条链,每条链中又调用自己的方法进行该链的遍历显示
for(int i = 0; i < EmployeeLinkListArray.length; i++) {
System.out.printf("第%d条链的数据信息:",i+1);
EmployeeLinkListArray[i].list();
}
}
//查找方法
public void find(int id) {
int group = getGroup(id);//先确定散列到哪条链表上
Employee e = EmployeeLinkListArray[group].find(id);
if(e != null) {
System.out.printf("编号为%d的职员在第%d条链上\n",id,group+1);
}else {
System.out.printf("id为%d的职员不存在\n",id);
}
}
//删除方法
public void delete(int id) {
int group = getGroup(id);//先确定散列到哪条链表上
EmployeeLinkListArray[group].delete(id);//该链进行删除操作
}
//修改方法
public void update(Employee e) {
int group = getGroup(e.id);//先确定散列到哪条链表上
EmployeeLinkListArray[group].update(e);//进行修改操作
}
//散列方法,这里我们就用最简单那的取模方法进行散列
public int getGroup(int id) {
return id % size;
}
}