2.2hash和hash表
一维hash
例题1:【模板】字符串哈希
- 注意:
- 使用unsigned long long的自然溢出代替取模运算
- 自定义hash函数要大写H,因为会与库中hash冲突
- 代码:
#include<bits/stdc++.h>
using namespace std;
typedef unsigned long long ull;
const int maxN=1e4+5;
const int P = 131;
int n;
char a[1505];
ull h[maxN];
inline ull Hash(){
scanf("%s",a+1);
ull res=0;
int len=strlen(a+1);
for(int i=1;i<=len;i++){
res=res*P+a[i];
}
return res;
}
int main(){
scanf("%d",&n);
for(int i=1;i<=n;i++){
h[i] = Hash();
}
sort(h+1,h+1+n);
n=unique(h+1,h+1+n)-h-1;
printf("%d\n",n);
return 0;
}
关于unique
- 用途:字符串去重
- 函数返回值:去重后最后一个字符的位置
- 利用该函数可求出字符串中不同字符的个数:
char h[40]; ...... int ans = unique(h+1,h+1+n)-h-1;
例题二:回文子串
- 思路:
回文子串:给定字符串中最长的子串且为回文串
性质:
奇回文串:字符串中某一位为中间位,从该位置向左右连边延申得到的子串相同(右侧子串倒着看)
偶回文串:中间位置无字符,以中间位置左边为中间位置,从该位置向左右连边延申得到的子串相同(右侧子串倒着看)
根据上述性质,可以枚举中心位置,二分两侧长度,判断两边哈希值是否相等即可
- 实现:
预处理出正反哈希值
int n=strlen(s+1);
mi[0]=1;
for(int i=1;i<=n;i++){
mi[i]=mi[i-1]*131ull;
up[i]=up[i-1]*131ull+s[i]-'a';
}
down[n+1]=0;
for(int i=n;i>=1;i--){
down[i]=down[i+1]*131ull+s[i]-'a';
}
取出子串哈希值
int pre=up[i]-up[i-len]*mi[l]
int suf=down[i]-down[i+l]*mi[l]
- 代码:
#include<bits/stdc++.h>
using namespace std;
typedef unsigned long long ull;
const int N = 1e6+5;
ull mi[N],up[N],down[N];
char s[N];
int main(){
scanf("%s",s+1);
int n=strlen(s+1);
int m=0;
while(s[1]!='E'||s[2]!='N'||s[3]!='D'){
mi[0]=1;
for(int i=1;i<=n;i++){
mi[i]=mi[i-1]*131ull;
up[i]=up[i-1]*131ull+s[i]-'a';
}
down[n+1]=0;
for(int i=n;i>=1;i--){
down[i]=down[i+1]*131ull+s[i]-'a';
}
int ans=0;
for(int i=1;i<=n;i++){//枚举回文中心
int l=0,r=n;//二分答案(从中心向两边的长度)
while(l<=r){//两边长度为mid+1 奇回文串 中间位置被两次使用
int mid=(l+r)>>1;
if(i-mid<1||i+mid>n)
r=mid-1;
else
if(up[i]-up[i-mid-1]*mi[mid+1]==down[i]-down[i+mid+1]*mi[mid+1])
ans=max(ans,mid*2+1),l=mid+1;
else
r=mid-1;
}
l=0,r=n;//二分答案(从中心向两边的长度)
while(l<=r){//两边长度为mid 偶回文串 中间位置的左边被当作中间,只用一次
int mid=(l+r)>>1;
if(i-mid<0||i+mid>n)
r=mid-1;
else
if(up[i]-up[i-mid]*mi[mid]==down[i+1]-down[i+mid+1]*mi[mid])
ans=max(ans,mid*2),l=mid+1;
else
r=mid-1;
}
}
m++;
printf("Case %d: %d\n",m,ans);
scanf("%s",s+1);
n=strlen(s+1);
memset(down,0,sizeof(down));
}
return 0;
}
- 注意:不要开太多
大龙unsigned long long
,否则会侧平举TLE
二维hash
例题3:对称正方形(P2601 [ZJOI2009] 对称的正方形 )
代码:
#include<bits/stdc++.h>
using namespace std;
typedef unsigned long long ull;
const int N = 1001;
int n,m,a[N][N],ans;
ull fanx[N][N],fany[N][N];
ull hx[N],hy[N];
ull p1=131,p2=313;
void Hash(){
hx[0]=1;hy[0]=1;
for(int i=1;i<=max(n,m);i++){
hx[i]=hx[i-1]*p1;
hy[i]=hy[i-1]*p2;
}
for(int i=1;i<=n;i++){
for(int j=1;j<=m;j++){
a[i][j]+=a[i-1][j]*p1;
fanx[i][j]+=fanx[i-1][j]*p1;
fany[i][j]+=fany[i-1][j]*p1;
}
}
for(int i=1;i<=n;i++){
for(int j=1;j<=m;j++){
a[i][j]+=a[i][j-1]*p2;
fanx[i][j]+=fanx[i][j-1]*p2;
fany[i][j]+=fany[i][j-1]*p2;
}
}
}
int check(int x,int y,int len){
int s1,s2,s3,x1,y1;
if(x<len||x>n||y<len||y>m) return 0;
s1=a[x][y]-a[x-len][y]*hx[len]-a[x][y-len]*hy[len]+a[x-len][y-len]*hx[len]*hy[len];//yuan
x1=n-(x-len);
s2=fanx[x1][y]-fanx[x1-len][y]*hx[len]-fanx[x1][y-len]*hy[len]+fanx[x1-len][y-len]*hx[len]*hy[len];//左右颠倒
y1=m-(y-len);
s3=fany[x][y1]-fany[x-len][y1]*hx[len]-fany[x][y1-len]*hy[len]+fany[x-len][y1-len]*hx[len]*hy[len];//上下颠倒
if(s1==s2&&s2==s3) return 1;
else return 0;
}
int main(){
// freopen("a.in","r",stdin);
// freopen("a.out","w",stdout);
scanf("%d%d",&n,&m);
for(int i=1;i<=n;i++){
for(int j=1;j<=m;j++){
cin>>a[i][j];
}
}
for(int i=1;i<=n;i++){
for(int j=1;j<=m;j++){
fanx[n-i+1][j]=fany[i][m-j+1]=a[i][j];
}
}
Hash();
int t,l,r,mid,x,y;
for(int i=1;i<=n-1;i++){//偶
for(int j=1;j<=m-1;j++){
t=0,l=0,r=max(n,m)+1,mid=0;
while(l<r){
mid=(l+r+1)>>1;
x=mid+i;
y=mid+j;
if(check(x,y,mid*2)){
t=mid;
l=mid;
}else r=mid-1;
}
ans+=t;
// cerr<<i<<' '<<j<<' '<<t<<endl;
}
}
for(int i=1;i<=n;i++){//奇
for(int j=1;j<=m;j++){
t=0,l=0,r=max(n,m)+1,mid=0;
while(l<r){
mid=(l+r+1)>>1;
x=mid+i;
y=mid+j;
if(check(x,y,mid*2+1)){
t=mid;
l=mid;
}else r=mid-1;
}
ans+=t;
}
}
// cerr<<ans<<endl;
ans+=n*m;
cout<<ans;
return 0;
}
- 注意:
- 双层for loop注意区分n,m
- check中注意判断边界
- 注意奇对称正方形和偶对称正方形在枚举中心时区间不同,即
for(int i=1;i<=n-1;i++){//偶 for(int j=1;j<=m-1;j++){ } } for(int i=1;i<=n;i++){//奇 for(int j=1;j<=m;j++){ } }
其原因为偶对称正方形的中心是枚举到的点右侧的空白处而奇为枚举到的点
例题4:单词背诵&&洛谷P1381
- 题解:
来自洛谷题解 - 代码:
#include <bits/stdc++.h>
using namespace std;
#define ll long long
const int maxn = 1010;
const int maxm = 1e5 + 10;
const int mod = 1e6;
const int p = 31;
const int INF = 1e9;
int n, m, cnt = 0, ans = INF, l, r;
int a[maxn], b[maxm], appear[mod];
char input[110];
bool need[mod], vis[mod];
int Hash(char s[]) { //传入一个字符串
int len = strlen(s);
ll ret = 0;
for (int i = 0; i <= len; i++) {
ret = ret * p + s[i] - 'a';
ret %= mod;
}
return ret %= mod;
}
int main() {
#ifndef ONLINE_JUDGE
freopen("a.in", "r", stdin);
freopen("a.out", "w", stdout);
#endif
scanf("%d", &n);
for (int i = 1; i <= n; i++) {
scanf("%s", input);
a[i] = Hash(input);
need[a[i]] = 1; //记为需要
}
scanf("%d", &m);
for (int i = 1; i <= m; i++) {
scanf("%s", input);
b[i] = Hash(input);
if (need[b[i]] && !vis[b[i]]) { //需要该单词且未出现
cnt++, vis[b[i]] = 1;
}
}
if (cnt) {
printf("%d\n", cnt);
} else {
puts("0");
puts("0");
return 0;
} //第一问结束
l = 1, r = 1;
while (1) {
if (cnt) { //此时cnt的意义为:还需要多少个
if (r > m)
break;
if (need[b[r]]) {
if (!appear[b[r]])
cnt--;
appear[b[r]]++;
}
r++;
} else {
while (!need[b[l]]) l++;
if (l > m)
break;
ans = min(ans, r - l);
if (appear[b[l]] == 1) {
cnt++;
}
if (appear[b[l]] >= 1) {
appear[b[l]]--, l++;
}
}
}
printf("%d", ans);
return 0;
}
// https://www.luogu.com.cn/blog/jdoiFSW/solution-p1381