后缀自动机——Longest Common Substring II

本篇博客介绍了如何使用后缀自动机解决多个字符串的最长公共子串问题。通过记录匹配过程中的最大长度,并采用top序策略找出最长公共子串的最小长度。
摘要由CSDN通过智能技术生成

题解:

上一个题是两个串的最长公共子串长度。这道题是多个串来求最长公共子串长度。我们记录匹配到每个状态的时候,到这个状态匹配的最大长度是多少。最后按照top序找最大的最小值。
收获了一个sam的板子。

#include <bits/stdc++.h>
using namespace std;
const int maxn=1e5+10;
const int maxc=27;
typedef long long ll;
struct Suffix_Automaton {
    int next[maxn<<1][maxc];  //状态转移(尾部加一个字符的下一个状态)
    int len[maxn<<1]; //最长子串的长度(该节点子串数量=len[x]-len[link[x]])
    int link[maxn<<1];   //后缀链接(最短串前部减少一个字符所到达的状态)
    //int cnt[maxn<<1];   //被后缀连接的数(*)
    int id; //结点编号
    int last; //最后结点
    ll endpos[maxn<<1]; // endpos数(一类子串的数量)
    int a[maxn];
    int b[maxn<<1];
    int dp[maxn<<1];
    int ans[maxn<<1];
    //ll d[maxn<<1];//d[i]表示从状态i出发,不同的子串的数目,即不同的路径数
    void init() {	//初始化
        for(int i=1; i<=id; i++){ //常规初始化
            link[i] = len[i] = 0;
            memset(next[i],0,sizeof(next[i]));
            endpos[i]=0;
            a[i]=0;
            b[i]=0;
        }
//		for(int i=1;i<=id;i++) {//非常规初始化 
//			d[i]=0;
//		}
        last = id = 1; //1表示root起始点 空集
    }
//SAM建图
    void add(int c) {     //插入字符,为字符ascll码值
        int x = ++id; //创建一个新结点x;
        len[x] = len[last] + 1; //  长度等于最后一个结点+1
        endpos[x] = 1;  //接受结点子串除后缀连接还需加一
        int p;  //第一个有C转移的结点;
        for (p = last; p && !next[p][c]; p = link[p])
            next[p][c] = x;//沿着后缀连接 将所有没有字符c转移的节点直接指向新结点
        if (!p){   //全部都没有c的转移 直接将新结点后缀连接到起点
            link[x] = 1;
            //	cnt[1]++;
        }
        else {
            int q = next[p][c];    //p通过c转移到的结点
            if (len[p] + 1 == len[q]){//pq是连续的
                link[x] = q;
                //	cnt[q]++; //将新结点后缀连接指向q即可,q结点的被后缀连接数+1
            }
            else {
                int nq = ++id;   //不连续 需要复制一份q结点
                len[nq] = len[p] + 1;   //令nq与p连续
                link[nq] = link[q];   //因后面link[q]改变此处不加cnt
                memcpy(next[nq], next[q], sizeof(next[q]));  //复制q的信息给nq
                for (; p&&next[p][c] == q; p = link[p])
                    next[p][c] = nq;    //沿着后缀连接 将所有通过c转移为q的改为nq
                link[q] = link[x] = nq; //将x和q后缀连接改为nq
                //cnt[nq] += 2; //  nq增加两个后缀连接
            }
        }
        last = x;  //更新最后处理的结点
    }
    ll getSubNum() {	//求不相同子串数量
        ll ans = 0;
        for (int i = 2; i <= id; i++)
            ans += len[i]-len[link[i]];	//一状态子串数量等于len[i]-len[link[i]]
        return ans;
    }
    void getTP(int Len){//对sam的节点按照len,从小到大排序重新标号,即给定节点的拓扑序
        for(int i=1;i<=id;i++) a[len[i]]++;
        for(int i=1;i<=Len;i++) a[i]+=a[i-1];
        for(int i=1;i<=id;i++) b[a[len[i]]--]=i;
    }
    void getendpos(){//求每类子串的数量 ,即endpos集合的大小
        for(int i=id;i>=1;i--){ //按拓扑序遍历
            int e=b[i];
            endpos[link[e]]+=endpos[e];
        }
    }
    void LLM(char s[],int Len){//求两个串的最长公共子串
        int ans=0,cnt=0;
        int now=1;
        char base='a';
        for(int i=0;i<Len;i++){
            int c=s[i]-base;
            if(next[now][c]){
                cnt++;
                now=next[now][c];
            }
            else{
                while(now&&!next[now][c]) now=link[now];
                if(!now) cnt=0,now=1;
                else cnt=len[now]+1,now=next[now][c];
            }
            ans=max(ans,cnt);
        }
        printf("%d\n",ans);
    }
    void LLM2(char s[],int Len){
        for(int i=1;i<=id;i++) dp[i]=0;
        int cnt=0;
        int now=1;
        char base='a';
        for(int i=0;i<Len;i++){
            int c=s[i]-base;
            if(next[now][c]){
                cnt++;
                now=next[now][c];
            }
            else{
                while(now&&!next[now][c]) now=link[now];
                if(!now) cnt=0,now=1;
                else cnt=len[now]+1,now=next[now][c];
            }
            dp[now]=max(dp[now],cnt);
        }
        for(int i=id;i>=1;i--){
            int e=b[i];
            dp[link[e]]=max(dp[link[e]],min(dp[e],len[link[e]]));
        }
        for(int i=1;i<=id;i++) ans[i]=min(ans[i],dp[i]);
    }
    void get_LLM2_ans(){
        int cnt=0;
        for(int i=1;i<=id;i++) cnt=max(cnt,ans[i]);
        printf("%d\n",cnt);
    }
    /*
    void solve1(){ //求出现次数为k的子串种数
        ll ans=0;
        for(int i=1;i<=id;i++){
            if(endpos[i]==K){
                ans+=len[i]-len[link[i]];
            }
        }
        printf("%lld\n",ans);
    }
     */
    /*
    void solve1(){//求出现次数A<=K<=B的子串种数
        for(int i=id;i>1;i--){
            int v=b[i];
            if(endpos[v]>=A&&endpos[v]<=B) d[v]++;
            for(int j=0;j<26;j++){
                if(next[v][j]) d[v]+=d[next[v][j]];
            }
        }
        ll ans=0;
        for(int i=0;i<26;i++){
            if(next[1][i]) ans+=d[next[1][i]];
        }
        printf("%lld\n",ans);
    }
    */
    /*
    void solve2(){//求出现次数>=k的子串的最大长度
        int ans=0;
        for(int i=1;i<=id;i++){
            if(endpos[i]>=K){
                ans=max(ans,len[i]);
            }
        }
        printf("%d\n",ans);
    }*/
    void init_ans(){
        for(int i=1;i<=id;i++) ans[i]=len[i];
    }
} sam;
char s[maxn];
signed main(){
    scanf("%s",s);
    sam.init();
    int len=strlen(s);
    for(int i=0;i<len;i++) sam.add(s[i]-'a');
    sam.getTP(len);
    sam.init_ans();
    while(~scanf("%s",s)){
        len=strlen(s);
        sam.LLM2(s,len);
    }
    sam.get_LLM2_ans();
}
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值