简介
模拟散列表是哈希算法的一种实现方式,有开放寻址法和拉链法两种方式,本次主要讲解开发寻址法,拉链法后续补充。
算法思想
开放寻址法采用hash函数找到在hash数组中对应的位置,如果该位置上有值,并且这个值不是寻址的值,则出现冲突碰撞,需要解决冲突方案,该算法采用简单的向右继续寻址来解决问题。
例如:
在语言模型中,编码器和解码器都是由一个个的 Transformer 组件拼接在一起形成的。
具体分析
让人费解的参数
const int N = 200003;
1.1开放寻址操作过程中会出现冲突的情况,一般会开成两倍的空间,减少数据的冲突
1.2如果使用%来计算索引, 把哈希表的长度设计为素数(质数)可以大大减小哈希冲突(将使用数组长度进行哈希,数组长度为质数)
比如
10%8 = 2 10%7 = 3
20%8 = 4 20%7 = 6
30%8 = 6 30%7 = 2
40%8 = 0 40%7 = 5
50%8 = 2 50%7 = 1
60%8 = 4 60%7 = 4
70%8 = 6 70%7 = 0
这就是为什么要找第一个比空间大的质数
实战题目
代码(C++版本)
//开放寻址法
/*
个人感觉开放寻址法就是在一个巨大的容器里面进行存放地址,
通常会把整个数组里面的元素值赋值为数据范围以外的数据,且数组的长度是限定的2~3倍
*/
#include<iostream>
#include<cstring>
using namespace std;
const long long int N=200003;
long long int h[N];
long long int t=0xffffffff;//数据范围自己设置,不知道的直接在最大范围后面加1 即可,
void inti()//初始化
{
for(int i=0;i<N;i++)
{
h[i]=t;
}
}
int find(int x)
{
int k=(x%N+N)%N;
while(h[k]!=t&&h[k]!=x)//搜索空的位置进行操作,当找到空位置的时候,结束循环
{
k++;//向后搜索
if(k==N)
{
k=0;//从0开始搜索
}
}
return k;
}
int main()
{
ios::sync_with_stdio(0);
cin.tie(0);
cout.tie(0);
int n;
cin>>n;
inti();//初始化函数
while(n--)
{
int x;
string op;
cin>>op>>x;
int k=find(x);
if(op=="I")
{
h[k]=x;
}
else
{
if(h[k]==t)
{
cout<<"No"<<endl;
}
else cout<<"Yes"<<endl;
}
}
// printf("t=%d",t);
return 0;
}
技术解释
ios::sync_with_stdio(0);
cin.tie(0);
cout.tie(0);
这个是让cin和cout断开和scanf和printf的链接,从而提速,但是使用之后C++程序里面不能再出现scanf和printf要不然程序会崩掉
小结
这个题目是进行搜索的算法题目,如果是需要存储然后进行其他操作,其实开放寻址法的思想依然是因,另外找个数组存储哈希值即可。