求排名为K的子串

5人阅读 评论(0) 收藏 举报
分类:

题目

给我们一个字符串,让我们求其所有不相同的子串中按字典序排名为K的子串

分析

先用SAM跑一遍。
然后在SAM上DP。
因为从SAM的起点跑可以跑出所有的子串,所以我们用dp[i]表示从i点出发跑出的子串的个数,显然有
dp[i]=∑ j=a,z dp[ch[i,j]]+1
然后每次按照a..za..z的顺序从起点开始dfs,如果沿ch[i,j]的方向走下去的个数≤k,就沿着这个方向往下走.
否则令k=k−dp[ch[i,j]]继续dfs。

code

#include<iostream>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<algorithm>
#include<vector>
#include<ctime>

#define LL long long 

using namespace std;

const int N=100205;

int n;
int len[N*2];
int ch[N*2][30],fail[N*2];
int root,cnt,last;

void ins(int x)
{
    int p,q,np,nq;
    p=last; last=np=++cnt;
    len[np]=len[p]+1; 
    for (;!ch[p][x]&&p;p=fail[p])
        ch[p][x]=np;

    if (p==0) fail[np]=root;
    else
    {
        q=ch[p][x];
        if (len[q]==(len[p]+1)) fail[np]=q;
        else{ 
            nq=++cnt;
            len[nq]=len[p]+1;
            for (int i=0;i<=26;i++) ch[nq][i]=ch[q][i];
            fail[nq]=fail[q];
            fail[q]=fail[np]=nq;
            for (;ch[p][x]==q;p=fail[p])
                ch[p][x]=nq;
        }
    }
}

char s[N];
int cc[N*2];
int q[N*2];
int f[N*2];

void query(int x)
{
    int p=1;
    while (x)
    {
        for (int i=0;i<26;i++)
            if (ch[p][i])
            {
                if (f[ch[p][i]]>=x)
                {
                    putchar('a'+i);
                    p=ch[p][i];
                    x--;
                    break;
                }
                else x-=f[ch[p][i]];
            }
    }
    printf("\n");
}

int work()
{
    scanf("%s",s);
    int m=strlen(s);
    last=cnt=root=1;
    for (int i=0;i<m*2;i++) ins(s[i]-'a');
    for (int i=1;i<=cnt;i++) ++cc[len[i]];
    for (int i=1;i<=cnt;i++) cc[i]+=cc[i-1];
    for (int i=1;i<=cnt;i++) q[cc[len[i]]--]=i;
    for (int i=cnt;i;i--)
    {
        f[q[i]]=1;
        for (int j=0;j<26;j++)
        {
            f[q[i]]+=f[ch[q[i]][j]];
        }
    }
    int x;
    scanf("%d",&x);
    query(x);
}

int main()
{
    work(); 
}
查看评论

ADO.NET快速起步 [特别推荐]

导 读:本文主要介绍了ADO.NET的基本特点,并且使用的一些代码展示了在ADO.NET中如何建立数据库连接,发送查询命令及使用DataReader对象快速浏览数据集方式。 翻译整理:.net技术网(...
  • coolstar
  • coolstar
  • 2001-05-05 14:03:00
  • 812

BZOJ 题目3998: [TJOI2015]弦论(后缀自动机求排名第k的子串,可重复)

3998: [TJOI2015]弦论 Time Limit: 10 Sec  Memory Limit: 256 MB Submit: 848  Solved: 274 [Submit][Sta...
  • yu_ch_sh
  • yu_ch_sh
  • 2015-09-05 22:53:39
  • 488

元素和是K的倍数的子串的最大长度

/***********************************************************************  * 元素和是K的倍数的子串的最大长度:  *  ...
  • yoomiky
  • yoomiky
  • 2017-09-01 18:41:05
  • 736

Splay 总结及模板

1.Splay、Rotate 操作 ————————(Splay 旋转) 2.GetPre、GetNext 操作 ——————–(获得前驱后继) 3.GetMin、GetMax 操作 ——————...
  • qq_39553725
  • qq_39553725
  • 2017-12-02 14:19:06
  • 71

hdu 4006 输入新数后输出第k大的数 set以及优先队列2中做法

The kth great number Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65768/65768 K (Java/Ot...
  • hnust_xiehonghao
  • hnust_xiehonghao
  • 2012-09-05 23:29:29
  • 3917

CodeForces 128B String 后缀数组 或 优先队列维护 求第K小子串

题目大意: 给出一个长度不超过10^5的字符串求其所有子串当中字典序排行第K(K 此题对于多个子串相同的视为不同子串,即起点不同也视为不同 大致思路: 刚开始想的是后缀数组的解法, ...
  • u013738743
  • u013738743
  • 2015-02-14 20:16:12
  • 969

HDU 4641 至少出现K次本质不同子串数:后缀自动机

题意:先给出一个串,然后有若干操作。操作1:在结尾续上一个新字符。操作2:查询至少出现了K次的,本质不同的子串个数。 题解:SAM裸题,插入一个新的字符之后,就暴力在parent上转移++,...
  • calabash_boy
  • calabash_boy
  • 2017-09-22 00:19:37
  • 187

2014西安网络预选赛1002(后缀数组求第K大的子串)hdu5008

Boring String Problem Time Limit: 6000/3000 MS (Java/Others)    Memory Limit: 65536/65536 K (Java/O...
  • cq_phqg
  • cq_phqg
  • 2014-09-14 23:58:59
  • 1634

SPOJ7258(后缀自动机--第k大的子串)

题目:http://www.spoj.com/problems/SUBLEX/   题意:给一个字符串,然后给Q个询问,每个询问输入一个数K,输出子串中字典序为K的字符串。 #include ...
  • ACdreamers
  • ACdreamers
  • 2013-09-01 16:26:25
  • 2196

SPOJ - SUBLEX Lexicographical Substring Search 求字典序第k小的子串

题目:求字符串字典序第k小的子串 思路:统计每个状态的子串的个数,按字典序寻找 代码: #pragma comment(linker, "/STACK:1024000000,1024000000...
  • ACVector
  • ACVector
  • 2017-09-15 22:07:28
  • 165
    个人资料
    持之以恒
    等级:
    访问量: 6万+
    积分: 3786
    排名: 1万+