#新的开始
从这篇博客开始我会将在博客里分享我在acwing社区学习和刷题的过程,有任何问题希望能多多指正。
以下是acwing社区主页
acwing社区主页
有部分截图截自yxc的讲解视频,侵删
模拟散列表
首先看一段摘自百度百科的话
Hash,一般翻译做散列、杂凑,或音译为哈希,是把任意长度的输入(又叫做预映射pre-image)通过散列算法变换成固定长度的输出,该输出就是散列值。
哈希即是把一个比较复杂的数据结构映射到0-n的数轴上
但由于总体值域很大,而映射的目标的范围小,所以一定会产生"冲突"
冲突即是有不同的数映射到了同一个元素上,这样的话就需要通过方式以解决冲突问题
如何处理冲突?
处理冲突的方法一般为两种:拉链法与开放寻址法
冲突处理方法1:拉链法
开一个哈希数组存储所有哈希值。当把某一个数映射到哈希表上的某一个值时,在相应的数组(我开的h[ ]数组)下拉一条链用来储存当前槽上已有的数(未哈希之前的原数)
- 每个拉链的表现形式是一个单链表(我们在这使用数组模拟的方法模拟单链表)
- 这个链表一般常用操作是插入和查询。如果需要删除操作,没用必要进行真正意义上的删除,即:
- 只需要为每个元素设立一个flag变量,删除操作时改变flag的值,也就是让链表忘记他,把他排除在外
- 这个链表一般常用操作是插入和查询。如果需要删除操作,没用必要进行真正意义上的删除,即:
tips1:哈希算法是一种期望算法,一般情况下每一条链的长度可看成常数。所以一般情况下哈希表的时间复杂度都很好,为O(1)。
tips2:在取区间的长度时,区间的长度最好是一个质数,这样的话冲突的平均概率是最小的。这个结论可以通过数学证明出来(自己可以去要查一下)。
bool find(int x)
{
int k=(x%N+N)%N;
for(int i=h[k];i!=-1;i=ne[i])
if(e[i]==x)
return true;
return false;
}
简单提一下数组模拟单链表:
两个数组一个变量:int e[N],ne[N],idx;
e数组存放值,ne数组存放各节点的下一个节点的位置,idx是当前处理到了哪个
void insert(int x)//insert模拟插入操作
{
int k=(x%N+N)%N; //一种哈希方式 由于x%N可能是负数,所以加上一个N(x%N+N)确保整体是正数
e[idx]=x;
ne[idx]=h[k];
h[k]=idx++;
}
冲突处理方法2:开放寻址法
只开一个数组,但是这个数组的长度要开到题目所给数据范围的两倍到三倍 存放所有的数
处理冲突的方法是通过一个find函数实现的,具体为:
find函数:返回值有两种情况:
第一种是在插入过程中,返回的int值代表find函数已经找到了一个可以放数x的空位,通知主函数把数放到返回值对应的位置上去
跳出while循环的判断条件是当前位置为空值
第二种是在查询过程中,返回的int值代表已经在k位置上找到了x,如果没有找到的话此返回位置对应的地方是null,依次判断yes or no
跳出while循环的判断条件是当前位置k上的值==x;如果没有找到x,则会因为该位置上是null而退出
int find(int x)
{
int k=(x%N+N)%N;
while(h[k]!=null&&h[k]!=x) //当前位置为空值或者h[k]==x时会跳出循环。注意是或者,因为要是
{
k++;
if(k==N) k=0; //如果while循环到了末尾还是没找到能插的位置就从数组头开始找
}
return k;
}
最后附上ac代码
拉链法
#include<iostream>
#include<stdio.h>
#include<cstring>
using namespace std;
const int N=100003;
int h[N];
int e[N],ne[N],idx; //为链表开的东西 数组模拟链表
void insert(int x)
{
int k=(x%N+N)%N; //一种哈希方式 由于x%N可能是负数,所以加上一个N(x%N+N)确保整体是正数
e[idx]=x;
ne[idx]=h[k];
h[k]=idx++;
}
bool find(int x)
{
int k=(x%N+N)%N;
for(int i=h[k];i!=-1;i=ne[i])
if(e[i]==x)
return true;
return false;
}
int main()
{
int n;
scanf("%d",&n);
memset(h,-1,sizeof h); //初始化h数组,空指针一般用-1来表示
while(n--)
{
char op[2];
int x;
scanf("%s%d",op,&x);
if(op[0]=='I') insert(x);
else
{
if(find(x)) puts("Yes");
else puts("No");
}
}
return 0;
}
开放寻址法
#include<iostream>
#include<stdio.h>
#include<cstring>
#include<cmath>
using namespace std;
const int N=100003, null=0x3f3f3f3f; //null定义为一个无穷大的量,之所以是四个3f是因为memset使以直接方式初始化的,而int占四个字节
int h[N]; //h数组中存放的都是元素哈希之前的原始真实值,哈希的意义是为数哈希出一个数组中的位置
int find(int x)
{
int k=(x%N+N)%N;
while(h[k]!=null&&h[k]!=x) //当前位置为空值或者h[k]==x时会跳出循环。注意是或者,因为要是
{
k++;
if(k==N) k=0; //如果while循环到了末尾还是没找到能插的位置就从数组头开始找
}
return k;
}
int main()
{
int n;
cin>>n;
memset(h,null,sizeof(h));
while(n--)
{
char op[2];
int x;
scanf("%s%d",op,&x);
int k=find(x); //开放寻址法的find函数在两个操作中都有用,所以放在判断结构外面
if(op[0]=='I') h[k]=x;
else
{
if(h[k]!=null) puts("Yes");
else puts("No");
}
}
return 0;
}