题目链接
https://vjudge.net/problem/POJ-3461
题意
t组数据,每组数据输入两个字符串s,c;求s在c中出现多少次,输出次数。
题解
这道题是个字符串匹配题,可以用kmp算法来做,也可用字符串hash。这两个算法的时间复杂度都是线性的。下边分别介绍两种算法。
字符串hash
在c语言里每个字符都可以看成一个数字,范围是0-127,比如‘a’=97; 所以一个字符串可以看成一个128进制的数字,即这个字符串的hash值。
比如字符串abc可以看成128进制的数字 97 98 99 ,等于97*128^2+98^1+99。
字符串hash函数把一个任意长度的字符串映射成一个非负整数,其冲突概率几乎为0.
可以在O(strlen(s))的时间内算出字符串s的hash值。
可以在O(strlen(c))的时间内算出c[1到i](1<=i<=strlen(c))的hash值,保存在数组里。
然后遍历一遍hash值,算长度为strlen(s)的子串有多少hash值与s的hash值相同
代码
#include<algorithm>
#include <iostream>
#include<cstring>
#include <cstdio>
using namespace std;
typedef unsigned long long ull;
const int maxn=1e6+10;
char c[maxn],s[maxn];
ull ha[maxn];
int main(){
int t;
cin>>t;
while(t--){
int n,m;
scanf("%s",s+1);
scanf("%s",c+1);
n=strlen(c+1);
m=strlen(s+1);
ull cnt=0;
ull p=1; //计算128的m次方,也可以用快速幂来算
for(int i=1;i<=m;i++){
cnt=cnt*128+s[i];
p*=128;
}
ha[0]=0;
for(int i=1;i<=n;i++){
ha[i]=128*ha[i-1]+c[i];
}
int ans=0;
for(int i=m;i<=n;i++){
if(ha[i]-ha[i-m]*p==cnt){
ans++;
}
}
cout<<ans<<endl;
}
return 0;
}
kmp
#include<algorithm>
#include <iostream>
#include<cstring>
#include <cstdio>
using namespace std;
typedef long long ll;
const int maxn=1e6+10;
char c[maxn],s[maxn];
int n,m;
int nxt[maxn];
void f(){
int k=-1,j=0;
nxt[0]=-1;
while(j<m)
if(k==-1||s[j]==s[k]){
nxt[++j]=++k;
}else
k=nxt[k];
}
int main(){
int t;
cin>>t;
while(t--){
scanf("%s",s);
scanf("%s",c);
m=strlen(s);
n=strlen(c);
f();
int ans=0;
int i=0,j=0;
while(i<n){
if(j==-1||c[i]==s[j]){
i++;j++;
}else{
j=nxt[j];
}
if(j==m){
j=nxt[j];
ans++;
}
}
cout<<ans<<endl;
}
return 0;
}