1304 字符串的相似度
题目来源:
基准时间限制:1 秒 空间限制:131072 KB 分值: 320
给出一个字符串S,计算S同他所有后缀的相似度之和。例如:S = “ababaa”,所有后缀为:
ababaa 6
babaa 0
abaa 3
baa 0
aa 1
a 1
S同所有后缀的相似度的和 = 6 + 0 + 3 + 0 + 1 + 1 = 11
Input
输入一个字符串S(1 <= L <= 1000000),L为字符串S的长度,且S由a-z的小写字母组成。
Output
输出S同所有后缀的相似度的和。
Input示例
ababaa
Output示例
11
思路:
先说一下什么是扩展kmp算法。
定义母串S,和字串T,设S的长度为n,T的长度为m,求T与S的每一个后缀的最长公共前缀,也就是说,设extend数组,extend[i]表示T与S[i,n-1]的最长公共前缀,要求出所有 extend[i](0<=i<n) 。
那么这道题就是求出S = s,T = s 的extend,但是要知道扩展kmp算法中Next数组的含义是:next[i]表示T[i,m-1]和T的最长公共前缀长度。注意其实这里就是和extend就类似了,因为如果把extend中的S改为T,就是Next,所以扩展kmp中next和extend求法相同。此题只需求出一次即可。
#include <iostream>
#include <cstdio>
#include <cstring>
#include <algorithm>
using namespace std;
const int maxn=1000005; //字符串长度最大值
char s[maxn];
int Next[maxn]/*,ex[maxn]*/; //ex数组即为extend数组
//预处理计算next数组
void GETNEXT(char *str)
{
int i=0,j,po,len=strlen(str);
Next[0]=len;//初始化next[0]
while(str[i]==str[i+1]&&i+1<len)//计算next[1]
i++;
Next[1]=i;
po=1; //初始化po的位置
for(i=2;i<len;i++)
{
if(Next[i-po]+i<Next[po]+po)//第一种情况,可以直接得到next[i]的值
Next[i]=Next[i-po];
else//第二种情况,要继续匹配才能得到next[i]的值
{
j=Next[po]+po-i;
if(j<0)j=0;//如果i>po+next[po],则要从头开始匹配
while(i+j<len&&str[j]==str[j+i])//计算next[i]
j++;
Next[i]=j;
po=i;//更新po的位置
}
}
}
/*
//计算extend数组
void EXKMP(char *s1,char *s2)
{
int i=0,j,po,len=strlen(s1),l2=strlen(s2);
GETNEXT(s2);//计算子串的next数组
while(s1[i]==s2[i]&&i<l2&&i<len)//计算ex[0]
i++;
ex[0]=i;
po=0;//初始化po的位置
for(i=1;i<len;i++)
{
if(Next[i-po]+i<ex[po]+po)//第一种情况,直接可以得到ex[i]的值
ex[i]=Next[i-po];
else//第二种情况,要继续匹配才能得到ex[i]的值
{
j=ex[po]+po-i;
if(j<0)j=0;//如果i>ex[po]+po则要从头开始匹配
while(i+j<len&&j<l2&&s1[j+i]==s2[j])//计算ex[i]
j++;
ex[i]=j;
po=i;//更新po的位置
}
}
}
*/
int main(int argc, char const *argv[])
{
// freopen("in.txt","r",stdin);
scanf("%s",s);
GETNEXT(s);
int ans = 0;
int length = strlen(s);
for(int i = 0;i < length; i++) {
ans += Next[i];
}
printf("%d\n",ans);
return 0;
}