2018-10-26 20:25:42
1455:【例题1】Oulipo
【题目描述】
给出两个字符串s1,s2((只有大写字母),求s1在s2中出现多少次。
例如:s1="ABA",s2="ABAABA",答案为2。
【输入】
输入T组数据,每组数据输出结果。
【输出】
如题述。
【输入样例】
3
BAPC
BAPC
AZA
AZAAZAAZA
VEEDI
AVERDXIVYERDLAN
【输出样例】
1
3
0
【提示】
1≤s1的长度 ≤104 ,1≤s2的长度 ≤106 。
【题目大意】
其实这道题就是一个哈希的模板题吧,然后我想写解题报告加深一下印象。
【思路】
我的思路就是哈希的思路(哈哈),然后具体说一下哈希的算法是怎么样的。
其实,哈希的功能就是解决像这道题目类型的,在一个字符串s2中匹配s1(找出现的位置或者出现的次数)
哈希的大体思想就是将每一段字符串或者大数据用变量直接来表示,这样只要直接比较两段字符串的哈希值
就可以直接判断这两段字符串或者大数据是不是相等。
第一个问题,怎么用变量表达字符串呢?
我们事先选一个合适的互质的b和h两个值(b<h),则字符串C=C1C2C3...Cm我们定义的哈希值是:
H[m]=(C1bm-1+C2bm-2+...+Cmb0)%h
那其实只要递推一下就可以解决了H[k]=H[k-1]*b+c[k];(暂不考虑%的东西)
举个例子:C=“ABCD”
H[1]=1;
H[2]=1*b+2;
H[3]=1*b2+2*b+3;
H[4]=1*b3+2*b2+3*b+4;
然后对于某一段字符串的哈希值,C‘=“BC”
H[C']=H[3]-H[1]*b2
就是对于C'=Ck+1Ck+2...Ck+n
H[C']=H[k+n]-H[k]*bn
第二个问题,怎么很好很快的算出bn的值?
其实只要先预处理一下就好了,power[n]=power[n-1]*b
第三个问题,怎么比较?
枚举s2从0开始到m-n(m表示s2的长度,n表示s1的长度),如果哈希值相等则这两段字符串相等。
然后代码插上!
#include<bits/stdc++.h> using namespace std; int T; int n,m; int ans; char s1[10000+10],s2[1000000+10]; unsigned long long power[1000000+10]; unsigned long long H[1000000+10]; unsigned long long s,b=27,h=1<<31; //unsigned long long 这是比long long还大的定义,但没有负值 int main() { power[0]=1; for(int i=1;i<=1000000;i++) power[i]=power[i-1]*b; scanf("%d",&T); while(T--) { scanf("%s%s",s1+1,s2+1); n=strlen(s1+1);m=strlen(s2+1); H[0]=0; for(int i=1;i<=m;i++) H[i]=(H[i-1]*b+(unsigned long long)(s2[i]-'A'+1))%h;//预处理出s2的每个字符前的哈希值 s=0; for(int i=1;i<=n;i++) s=(s*b+(unsigned long long)(s1[i]-'A'+1))%h;//算出s1的哈希值 ans=0; //for(int i=1;i<=m;i++) //cout<<H[i]<<endl; //cout<<s<<endl; for(int i=0;i<=m-n;i++) if(s==H[i+n]-H[i]*power[n]) ans++; printf("%d\n",ans); } return 0; }