#1445 : 后缀自动机二·重复旋律5 后缀自动机 本质不同字串个数

SAM建出满足后缀自动机性质的DAG。

显然上述是对的,因为这个DAG上每条从S到任意点路径上组成的字符串,都是原串的子串,根据字典树的性质,显然所有路径中不会有相同的字串。

而根据后缀自动机节点的性质:每个节点表示一个endpos集合,集合内包含的字符串个数为:maxlen[i] - minlen[i] +1

而包含的字符串刚好是到达该点路径组成的字符串。

而SAM过程中我们记录了maxlen,minlen就等于 maxlen[link[i]]+1

于是每个点包含的字符串为:maxlen[i]-maxlen[link[i]];

 

#include<bits/stdc++.h>
#define ll long long
using namespace std;
const int M=1e6+3;
struct SAM {
	int maxlen[M*2], trans[M*2][26], link[M*2], size, last;
	SAM() { size = last = 1; }
	inline void extend(int id) {
		int cur = (++ size), p;
		maxlen[cur] = maxlen[last] + 1;
		for (p = last; p && !trans[p][id]; p = link[p]) trans[p][id] = cur;
		if (!p) link[cur] = 1;
		else {
			int q = trans[p][id];
			if (maxlen[q] == maxlen[p] + 1) link[cur] = q;
			else {
				int clone = (++ size);
				maxlen[clone] = maxlen[p] + 1;
				for(int i=0;i<26;i++)trans[clone][i]=trans[q][i];
				link[clone] = link[q];
				for (; p && trans[p][id] == q; p = link[p]) trans[p][id] = clone;
				link[cur] = link[q] = clone;
			}
		} 
		last = cur;
	}
	inline void gao(){//本质不同字符字串个数 
        ll ans=0;
        for(int i=2;i<=last;++i)ans+=maxlen[i]-maxlen[link[i]];
        printf("%lld\n",ans);
    }
}sam;
char s[M];
int main(){
	scanf("%s",s+1);
	int n=strlen(s+1);
	for(int i=1;i<=n;i++)sam.extend(s[i]-'a');
    sam.gao();
    return 0;
}

 

 

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值