1. 散列(Hash)表
(1) 负载因子
= 已有元素数/数组长度
(2) 哈希函数
[1]除余法 h(x) = x % M
[2] 乘余取整法 h(x) = floor(A 乘 x的小数部分)
[3] 平方取中法 先平方,然后取中间几位
[4] 基数转换法 换成其他进制,然后取其中几位
[5] ELFhash字符串
(3) 聚集和二级聚集
(4) 解决冲突的方式
[1] 开散列方法(拉链法)
[2] 闭散列方法(开放寻址法)
a. 线性探查法 d(i) = (d(0) + i c) % M。易产生聚集问题。
b. 二次探查法。易产生二级聚集问题。
d(2i - 1) = (d(0) + i^2) % M
d(2i) = (d(0) - d ^2) % M
c. 随机探查法。易产生二级聚集问题。
d. 双散列探查法
-
字符串模式匹配(KMP)
-
查找算法的分析及应用
题目描述
维护一个集合,支持如下几种操作:
I x
,插入一个数 x x x;Q x
,询问数 x x x 是否在集合中出现过;
现在要进行 N N N 次操作,对于每个询问操作输出对应的结果。
输入格式
第一行包含整数 N N N,表示操作数量。
接下来
N
N
N 行,每行包含一个操作指令,操作指令为 I x
,Q x
中的一种。
输出格式
对于每个询问指令 Q x
,输出一个询问结果,如果
x
x
x 在集合中出现过,则输出 Yes
,否则输出 No
。
每个结果占一行。
数据范围
1
<
=
N
<
=
1
0
5
1 <= N <= 10^5
1<=N<=105
−
1
0
9
<
=
x
<
=
1
0
9
-10^9 <= x <= 10^9
−109<=x<=109
输入样例:
5
I 1
I 2
I 3
Q 2
Q 5
输出样例:
Yes
No
算法
拉链法
#include<bits/stdc++.h>
using namespace std;
typedef long long LL;
const int N = 200003;
int n;
int h[N], e[N], ne[N], idx;
bool find(int x){
int t = (x % N + N) % N;
for(int i = h[t]; ~i; i = ne[i])
if(e[i] == x)
return true;
return false;
}
void add(int a, int b){
e[idx] = b, ne[idx] = h[a], h[a] = idx ++;
}
void insert(int x){
if(find(x)) return;
int t = (x % N + N) % N;
add(t, x);
}
int main(){
memset(h, -1, sizeof h);
scanf("%d", &n);
while(n --){
char op[2];
int x;
scanf("%s%d", op, &x);
if(*op == 'I') insert(x);
else{
if(find(x)) puts("Yes");
else puts("No");
}
}
return 0;
}
开放寻址法
#include<bits/stdc++.h>
using namespace std;
typedef long long LL;
const int N = 200003, null = 0x3f3f3f3f;
int n;
int h[N];
int find(int x){
int t = (x % N + N) % N;
while(h[t] != null && h[t] != x)
t = (t + 1) % N;
return t;
}
int main(){
memset(h, 0x3f, sizeof h);
scanf("%d", &n);
while(n --){
char op[2];
int x;
scanf("%s%d", op, &x);
if(*op == 'I') h[find(x)] = x;
else{
if(h[find(x)] == null) puts("No");
else puts("Yes");
}
}
return 0;
}
题目描述
给定一个模式串 S S S,以及一个模板串 P P P,所有字符串中只包含大小写英文字母以及阿拉伯数字。
模板串 P P P 在模式串 S S S 中多次作为子串出现。
求出模板串 P P P 在模式串 S S S 中所有出现的位置的起始下标。
输入格式
第一行输入整数 N N N,表示字符串 P P P 的长度。
第二行输入字符串 P P P。
第三行输入整数 M M M,表示字符串 S S S 的长度。
第四行输入字符串 S S S。
输出格式
共一行,输出所有出现位置的起始下标(下标从 0 0 0 开始计数),整数之间用空格隔开。
数据范围
1
>
=
N
>
=
1
0
5
1 >= N >= 10^5
1>=N>=105
1
>
=
M
>
=
1
0
6
1 >= M >= 10^6
1>=M>=106
输入样例:
3
aba
5
ababa
输出样例:
0 2
算法
C++ 代码
#include<bits/stdc++.h>
using namespace std;
typedef long long LL;
const int N = 100010, M = 1000010;
int n, m;
char p[N], s[N];
int ne[N];
int main(){
scanf("%d%s", &n, &p + 1);
scanf("%d%s", &m, &s + 1);
for(int i = 2, j = 0; i <= n; i++){
while(j && p[i] != p[j + 1]) j = ne[j];
if(p[i] == p[j + 1]) j ++;
ne[i] = j;
}
for(int i = 1, j = 0; i <= m; i++){
while(j && s[i] != p[j + 1]) j = ne[j];
if(s[i] == p[j + 1]) j++;
// printf("i = %d j = %d\n", i, j);
if(j == n) printf("%d ", i - n);
}
return 0;
}