题目
给定一个只包含小写字母的字符串S(|S|<=1e6),
请你求出 S 的所有出现次数不为 1 的子串的出现次数乘上该子串长度的最大值。
思路来源
https://www.cnblogs.com/cjyyb/p/8446349.html
题解
一个串的出现次数等于endpos集合的大小,
叶子结点的出现次数显然为1,因为在树上不可再分
而一个节点endpos的大小等于所有parent树上儿子的大小
考虑到,父亲的串一定比儿子的串短,所以对长度基数排拓扑序,
短的排在前面,长的在后面,然后从长的向短的(树的底层向上层)更新,
这样就不用建parent树了,每个节点的size是其right/endpos集合的大小
对于每个size>1的节点,ans=max(longest∗size)
心得
size的大小可以单独拿出来考虑,
如果放在node里,在第三种情况nq复制节点的时候要将sz强制清零,
因为只有叶子节点的大小是明确的1,
nq产生时,是一个分支节点,需要从后续儿子节点里更新获取sz
代码
#include<bits/stdc++.h>
using namespace std;
const int N=1e6+10;
typedef long long ll;
struct SAM{
struct NODE
{
int ch[26];
int len,fa,sz;
NODE(){memset(ch,0,sizeof(ch));len=sz=0;}
}dian[N<<1];
int las=1,tot=1,len;//rt为1 代表空串
char s[N];
void add(int c)
{
int p=las;int np=las=++tot;
dian[np].sz=1;
dian[np].len=dian[p].len+1;
for(;p&&!dian[p].ch[c];p=dian[p].fa)dian[p].ch[c]=np;
if(!p)dian[np].fa=1;//以上为case 1
else
{
int q=dian[p].ch[c];
if(dian[q].len==dian[p].len+1)dian[np].fa=q;//以上为case 2
else
{
int nq=++tot;dian[nq]=dian[q];
dian[nq].sz=0;
dian[nq].len=dian[p].len+1;
dian[q].fa=dian[np].fa=nq;
for(;p&&dian[p].ch[c]==q;p=dian[p].fa)dian[p].ch[c]=nq;//以上为case 3
}
}
}
void init()
{
scanf("%s",s);len=strlen(s);
for(int i=0;i<len;i++)add(s[i]-'a');
}
}sam;
int c[N<<1],a[N<<1];//c用于基数排序 a用于记录点号
ll ans;
int main()
{
sam.init();
for(int i=1;i<=sam.tot;++i)c[sam.dian[i].len]++;
for(int i=1;i<=sam.tot;++i)c[i]+=c[i-1];
for(int i=1;i<=sam.tot;++i)a[c[sam.dian[i].len]--]=i;
for(int i=sam.tot;i>=1;--i){
int now=a[i],par=sam.dian[now].fa;
sam.dian[par].sz+=sam.dian[now].sz;
if(sam.dian[now].sz>1){
ans=max(ans,1ll*sam.dian[now].sz*sam.dian[now].len);
}
}
printf("%lld\n",ans);
return 0;
}