Description
邪恶的707刚刚从白垩纪穿越回来,心中产生了一个念头:我要统治人类!
但是统治人类是很庞大且复杂的一个工程,707尝试了洗脑,催眠,以及武装镇压都没能成功地统治人类,于是她决定从科学上对人类的基因进行研究从而达到他的目的。
707获取了人类的基因信息并尝试对基因进行实验。他发现可以把人类的基因看做一个只包含小写字母的字符串,并定义从头开始任意长度的基因为“源头基因”人类身上与源头基因完全匹配的片段越多,这个人就越容易被控制。于是707就开始了他邪恶的计划……
作为人类卫士的射手ZMiG自然不会让707得逞,他决定拯救人类,现在他拿到了其中一个人被改造后的基因,他想请你统计一下它的基因中究竟有多少基因片段是可以与源头基因相匹配的
Input
输入一个只包含小写字母的字符串S
Output
输出一个整数,代表可以与源头基因相匹配的基因片段数量。
Sample Input
【样例输入1】
aaba
【样例输入2】
niconiconi
Sample Output
【样例输出1】
6
【样例解释1】
这六个片段分别为(1,1),(1,2),(1,3),(1,4),(2,2),(4,4)
【样例输出2】
18
Data Constraint
对于30% 的数据,|S|<= 200
对于60% 的数据,|S|<= 2000
对于100%的数据,|S|<= 10^6
The Solution
这道题乍一看,怎么一眼kmp??
没错这就是kmp,而且还是类似的exkmp!!
比赛时还有人打SA!!不过可怜的被卡常只有80分了。
SA的常数太大了
真的是无奇不有。。。
而我比赛是则打得是二分+hash求最长公共前缀
时间复杂度也是O(n log n)的。
有人说“SA 也是n log n”的为什么没过~~
你也不看看常数多大!!
还有另一种题解,就是kmp的:
相当于对于每个前缀求有多少个字符串和他相等
可以先求出 KMP 的 next 数组,然后对于一个位置,
每跳一次 next 就说明多了一个合法的匹配。
一个暴力方法是直接从每个节点开始跳统计答案。
显然我们可以用 f[i]表示以 i 为结尾有多少组这样的匹配,
然后可以发现 f[i]=f[next[i]]+1,这样 O(N)扫一遍就可以了
CODE
垫底程序。。。O(n log n)
#include <cstdio>
#include <iostream>
#include <cmath>
#include <algorithm>
#include <cstring>
#define fo(i,a,b) for (int i=a;i<=b;i++)
#define N 1000005
using namespace std;
typedef long long ll;
const int mo = 998244353;
char s[N];
ll ans = 0,Pret[N],h[N];
int Calc(int x,int y)
{
return (h[x+y-1] - (ll)h[x-1] * Pret[y] % mo + mo) % mo;
}
ll find(int l,int r)
{
int i = l;
ll res = 0;
while (l <= r)
{
int mid = (l + r) >> 1;
if (Calc(i,mid - i + 1) == Calc(1,mid - i + 1)) res = mid - i + 1, l = mid + 1;
else r = mid - 1;
}
return res;
}
int main()
{
freopen("gene.in","r",stdin);
freopen("gene.out","w",stdout);
scanf("%s",s + 1);
int n = strlen(s + 1);
Pret[0] = 1;
fo(i,1,n)
{
Pret[i] = (ll)Pret[i - 1] * 26 % mo;
h[i] = ((ll)h[i - 1] * 26 % mo + s[i] - 'a') % mo;
}
fo(i,1,n) ans += find(i,n);
printf("%lld\n",ans);
}