哈希表:一般哈希,字符串哈希(附例题)

这篇博客探讨了两种哈希表的实现方法——开放寻址法和拉链法,以及字符串哈希的计算原理。开放寻址法通过在哈希表范围内寻找空位解决冲突,而拉链法则使用链表链接相同哈希值的元素。此外,介绍了字符串哈希的p进制表示法,以及如何通过模运算减少冲突。ACWing的两道题目分别展示了这两种方法在实际问题中的应用。
摘要由CSDN通过智能技术生成

存储结构

1.开放寻址法(y总推荐)
开到题目范围的2-3倍,开放寻址法原理类似于上厕所
2.拉链法
类似于邻接表

字符串哈希方式

本质:用一个p进制的数来表示字符串
p进制
1.把字符串看成p进制的数
2,.把p进制的数转化为10进制的数
3.对整个数modQ
这样,就可以把任何一个字符串映射到0~Q-1之间的数了
两个原则
1.不能映射成0
2.人品足够好,不存在冲突
当p=131或13331
Q取成2e64
此时,绝大多数情况下是没有冲突的。
除了循环节,大多数问题上,kmp都打不过字符串哈希

哈希表常用操作

算法里常考:添加,查找
如果非要实现删除,也不是真正删掉这个点,而是开一个布尔变量标记

哈希函数

一般都直接取模,取模的数一般来说取质数,并且这个数要离2的整次幂尽可能远。可以证明,这样做引起冲突的概率最小。

冲突

拉链法:开一个一维数组,存储所有哈希值,在每一个槽上加一个链,用来存储这个槽上有的所有冲突的数。

AcWing 840. 模拟散列表
维护一个集合,支持如下几种操作:
“I x”,插入一个数x;
“Q x”,询问数x是否在集合中出现过;
现在要进行N次操作,对于每个询问操作输出对应的结果。

输入格式
第一行包含整数N,表示操作数量。

接下来N行,每行包含一个操作指令,操作指令为”I x”,”Q x”中的一种。

输出格式
对于每个询问指令“Q x”,输出一个询问结果,如果x在集合中出现过,则输出“Yes”,否则输出“No”。

每个结果占一行。

数据范围
1≤N≤105
−109≤x≤109
输入样例:
5
I 1
I 2
I 3
Q 2
Q 5
输出样例:
Yes
No

拉链法

#include <bits/stdc++.h>
using namespace std;
const int N = 100003;
int h[N], ne[N], e[N], idx;
void myinsert(int x)
{
    int k = (x % N + N) % N;
    e[idx] = x;
    ne[idx] = h[k];
    h[k] = idx++;
}
bool myfind(int x)
{
    int k = (x % N + N) % N;
    for(int i = h[k]; i != -1; i = ne[i])
    {
        if(e[i] == x)
            return true;
    }
    return false;
}
int main()
{
    ios::sync_with_stdio(false);
    cin.tie(0);
    int n, x;
    string s;
    memset(h, -1, sizeof h);
    cin >> n;
    while(n--)
    {
        cin >> s >> x;
        if(s == "I")
            myinsert(x);
        if(s == "Q")
        {
            if(myfind(x))
                cout << "Yes" << '\n';
            else
                cout << "No" << '\n';
        }
    }
    return 0;
}

开放寻址法

#include <bits/stdc++.h>
using namespace std;
const int N = 200003;
const int null = 0x3f3f3f3f;
int h[N];
int myfind(int x)
{
    int t = (x % N + N) % N;
    while(h[t] != null && h[t] != x)
    {
        t++;
        if(t == N)
            t = 0;
    }
    return t;
}
int main()
{
    ios::sync_with_stdio(false);
    cin.tie(0);
    int n, x;
    string s;
    memset(h, 0x3f, sizeof h);
    cin >> n;
    while(n--)
    {
        cin >> s >> x;
        if(s == "I")
        {
            h[myfind(x)] = x;
        }
        if(s == "Q")
        {
            if(h[myfind(x)] == null)
                cout << "No" << '\n';
            else
                cout << "Yes" << '\n';
        }
    }
    return 0;
}

注意点:memset是按字节赋值,所以保险的取值是0或者-1

ACWING841 字符串哈希
题目描述
给定一个长度为n的字符串,再给定m个询问,每个询问包含四个整数l1,r1,l2,r2l1,r1,l2,r2,请你判断[l1,r1l1,r1]和[l2,r2l2,r2]这两个区间所包含的字符串子串是否完全相同。

字符串中只包含大小写英文字母和数字。

输入格式
第一行包含整数n和m,表示字符串长度和询问次数。

第二行包含一个长度为n的字符串,字符串中只包含大小写英文字母和数字。

接下来m行,每行包含四个整数l1,r1,l2,r2l1,r1,l2,r2,表示一次询问所涉及的两个区间。

注意,字符串的位置从1开始编号。

输出格式
对于每个询问输出一个结果,如果两个字符串子串完全相同则输出“Yes”,否则输出“No”。

每个结果占一行。

数据范围
1≤n,m≤1051≤n,m≤105
输入样例:
8 3
aabbaabb
1 3 5 7
1 3 6 8
1 2 1 2
输出样例:
Yes
No
Yes

AC代码

#include <bits/stdc++.h>
using namespace std;
const int N = 100010, P = 131;
typedef unsigned long long ULL;
int h[N], p[N];
char x[N];
ULL query(int l, int r)
{
    return h[r] - h[l - 1] * p[r - l + 1];
}
int main()
{
    ios::sync_with_stdio(false);
    cin.tie(0);
    int n, m, l1, r1, l2, r2;
    h[0] = 0, p[0] = 1;
    cin >> n >> m;
    cin >> x + 1;
    for(int i = 1; i <= n; i++)
    {
        h[i] = h[i - 1] * P + x[i];
        p[i] = p[i - 1] * P;
    }
    while(m--)
    {
        cin >> l1 >> r1 >> l2 >> r2;
        if(query(l1, r1) == query(l2, r2))
            cout << "Yes" << '\n';
        else
            cout << "No" << '\n';
    }
    return 0;
}

注意点:p[i]表示p的i次方的值,h[i]表示从1到i的字符串的哈希值,也就是字符串的前缀值。
用unsigned long long来存h和p数组,可以省去modQ这个过程。
公式
对形如 X1X2X3⋯Xn−1XnX1X2X3⋯Xn−1Xn 的字符串,采用字符的ascii 码乘上 P 的次方来计算哈希值。
映射公式 (X1×Pn−1+X2×Pn−2+⋯+Xn−1×P1+Xn×P0)modQ

对于字符串x1x2x3
h[1] = x1
h[2] = h[1] * P + x2 = x1 * p + x2
h[3] = h[2] * p + x3 = x1 * p^2 + x2 * p + x3
现在我们想求x2x3的哈希值,可以记成是x2 * p+x3。可见这个表达式和h[3]只差一个x1 * p^2。我们可以把h[1]乘以p的二次方,而2 = 3 - 2 + 1(r - l + 1),1 = 2 - 1(l - 1)。
故从2到3的字符串哈希值为:h[3] - h[2-1] * p[3-2+1]

推到一般情形,从l到r的字符串哈希值为:h[r] - h[l-1] * p[r-l+1]

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值