题意:
给定一个字符串S,对于一个整数K,定义S的子串T=S(i, j)是关于第K位的识别子串,满足以下两个条件:
1、i≤K≤j。
2、子串T只在S中出现过一次。
例如,S=“banana”,K=5,则关于第K位的识别子串有"nana",“anan”,“anana”,“nan”,“banan"和"banana”。
现在,给定S,求对于S的每一位,最短的识别子串长度是多少
题解:
建出SAM,我们发现可以作为识别子串需要只出现一次,所以就是SAM的parent树上的叶子节点。我们设
l
=
l
e
n
[
i
]
−
l
e
n
[
f
a
[
i
]
]
l=len[i]-len[fa[i]]
l=len[i]−len[fa[i]],
r
=
l
e
n
[
i
]
r=len[i]
r=len[i],那么对于
i
∈
[
l
,
r
]
i\in[l,r]
i∈[l,r],
a
n
s
[
i
]
=
m
i
n
{
l
e
n
[
f
a
[
i
]
]
+
1
}
=
r
−
l
+
1
ans[i]=min\{len[fa[i]]+1\}=r-l+1
ans[i]=min{len[fa[i]]+1}=r−l+1。因为父节点代表的串在子节点又出现过了,所以最短没出现的就是父节点+1。
对于
i
∈
[
1
,
l
)
i\in[1,l)
i∈[1,l),因为
[
l
,
r
]
[l,r]
[l,r]这一段是唯一的,所以加上一个前缀后仍是唯一的,于是可以用每个
i
i
i到
r
r
r的长度来更新答案,即
r
−
i
+
1
r-i+1
r−i+1。而我们在回答时,
i
i
i是已知的,所以不用维护这个
i
i
i,我们只需要对每个位置维护最小的
r
r
r就行了。
于是我们需要开两棵线段树,分别维护两种情况的答案,然后取个min即可。
代码:
#include <bits/stdc++.h>
using namespace std;
int n,fa[400010],ch[400010][26],len[400010],sz[400010],lst=1,rt=1,cnt=1;
int vis[400010];
char s[100010];
struct node
{
int l,r,mn,tag;
}tr1[1600010],tr2[1600010];
inline void insert(int x)
{
int cur=++cnt,pre=lst;
lst=cur;
len[cur]=len[pre]+1;
for(;pre&&!ch[pre][x];pre=fa[pre])
ch[pre][x]=cur;
if(!pre)
fa[cur]=rt;
else
{
int ji=ch[pre][x];
if(len[ji]==len[pre]+1)
fa[cur]=ji;
else
{
int gg=++cnt;
len[gg]=len[pre]+1;
memcpy(ch[gg],ch[ji],sizeof(ch[ji]));
fa[gg]=fa[ji];
fa[ji]=fa[cur]=gg;
for(;pre&&ch[pre][x]==ji;pre=fa[pre])
ch[pre][x]=gg;
}
}
}
inline void build(int rt,int l,int r)
{
tr1[rt].l=l;
tr1[rt].r=r;
tr1[rt].tag=2e9;
tr2[rt].l=l;
tr2[rt].r=r;
tr2[rt].tag=2e9;
if(l==r)
{
tr1[rt].mn=2e9;
tr2[rt].mn=2e9;
return;
}
int mid=(l+r)>>1;
build(rt<<1,l,mid);
build(rt<<1|1,mid+1,r);
tr1[rt].mn=2e9;
tr2[rt].mn=2e9;
}
inline void pushdown1(int rt)
{
tr1[rt<<1].mn=min(tr1[rt<<1].mn,tr1[rt].tag);
tr1[rt<<1|1].mn=min(tr1[rt<<1|1].mn,tr1[rt].tag);
tr1[rt<<1].tag=min(tr1[rt<<1].tag,tr1[rt].tag);
tr1[rt<<1|1].tag=min(tr1[rt<<1|1].tag,tr1[rt].tag);
tr1[rt].tag=2e9;
}
inline void update1(int rt,int le,int ri,int x)
{
if(le>ri)
return;
int l=tr1[rt].l,r=tr1[rt].r;
if(le<=l&&r<=ri)
{
tr1[rt].mn=min(tr1[rt].mn,x);
tr1[rt].tag=min(tr1[rt].tag,x);
return;
}
pushdown1(rt);
int mid=(l+r)>>1;
if(le<=mid)
update1(rt<<1,le,ri,x);
if(mid+1<=ri)
update1(rt<<1|1,le,ri,x);
tr1[rt].mn=min(tr1[rt<<1].mn,tr1[rt<<1|1].mn);
}
inline void pushdown2(int rt)
{
tr2[rt<<1].mn=min(tr2[rt<<1].mn,tr2[rt].tag);
tr2[rt<<1|1].mn=min(tr2[rt<<1|1].mn,tr2[rt].tag);
tr2[rt<<1].tag=min(tr2[rt<<1].tag,tr2[rt].tag);
tr2[rt<<1|1].tag=min(tr2[rt<<1|1].tag,tr2[rt].tag);
tr2[rt].tag=2e9;
}
inline void update2(int rt,int le,int ri,int x)
{
if(le>ri)
return;
int l=tr2[rt].l,r=tr2[rt].r;
if(le<=l&&r<=ri)
{
tr2[rt].mn=min(tr2[rt].mn,x);
tr2[rt].tag=min(tr2[rt].tag,x);
return;
}
pushdown2(rt);
int mid=(l+r)>>1;
if(le<=mid)
update2(rt<<1,le,ri,x);
if(mid+1<=ri)
update2(rt<<1|1,le,ri,x);
tr2[rt].mn=min(tr2[rt<<1].mn,tr2[rt<<1|1].mn);
}
inline int query1(int rt,int x)
{
int l=tr1[rt].l,r=tr1[rt].r;
if(l==r)
return tr1[rt].mn;
pushdown1(rt);
int mid=(l+r)>>1;
if(x<=mid)
return query1(rt<<1,x);
else
return query1(rt<<1|1,x);
}
inline int query2(int rt,int x)
{
int l=tr2[rt].l,r=tr2[rt].r;
if(l==r)
return tr2[rt].mn;
pushdown2(rt);
int mid=(l+r)>>1;
if(x<=mid)
return query2(rt<<1,x);
else
return query2(rt<<1|1,x);
}
int main()
{
scanf("%s",s+1);
n=strlen(s+1);
for(int i=1;i<=n;++i)
insert(s[i]-'a');
for(int i=1;i<=cnt;++i)
vis[fa[i]]=1;
build(1,1,n);
for(int i=1;i<=cnt;++i)
{
if(!vis[i])
{
int r=len[i],l=len[i]-len[fa[i]];
update1(1,l,r,r-l+1);
update2(1,1,l-1,r);
}
}
for(int i=1;i<=n;++i)
printf("%d\n",min(query1(1,i),query2(1,i)-i+1));
return 0;
}