POJ1743(后缀数组)

题目

题意:有N(1 <= N <=20000)个音符的序列来表示一首乐曲,每个音符都是1..88范围内的整数,现在要找一个重复的主题。“主题”是整个音符序列的一个子串,它需要满足如下条件:
1.长度至少为5个音符。
2.在乐曲中重复出现。(可能经过转调,“转调”的意思是主题序列中每个音符都被加上或减去了同一个整数值)
3.重复出现的同一主题不能有公共部分。

即给出一串字符,求不重合的最长重复子串,并且长度大于要求的k值.

思路:将height值分组,然后记录在二分答案时满足height值>=p的sa[i]的最大最小值,然后要是最大值减去最小值会>=p,这就说明两个子串的lcp值>=p并且它们的坐标也相差>=p。
另外避免“转调”的影响,通过求相邻序列的差值解决。

#include<iostream>
#include<stdio.h>
#include<string.h>
using namespace std;
#define maxx 20010
int wsf[maxx],wa[maxx],wv[maxx],wb[maxx],s[maxx];
int height[maxx],rank[maxx],sa[maxx];
int cmp(int *r,int a,int b,int k)
{
    return r[a]==r[b]&&r[a+k]==r[b+k];
}
void getsa(int *r,int *sa,int n,int m)
{
    int i,j,p,*x=wa,*y=wb,*t;
    for(i=0;i<m;i++)  wsf[i]=0;
    for(i=0;i<n;i++)  wsf[x[i]=r[i]]++;
    for(i=1;i<m;i++)  wsf[i]+=wsf[i-1];
    for(i=n-1;i>=0;i--)  sa[--wsf[x[i]]]=i;
    j=1;
    p=1;
    for(;p<n;j*=2,m=p)
    {
        for(p=0,i=n-j;i<n;i++)  y[p++]=i;
        for(i=0;i<n;i++)  if(sa[i]>=j)  y[p++]=sa[i]-j;
        for(i=0;i<n;i++)  wv[i]=x[y[i]];
        for(i=0;i<m;i++)  wsf[i]=0;
        for(i=0;i<n;i++)  wsf[wv[i]]++;
        for(i=1;i<m;i++)  wsf[i]+=wsf[i-1];
        for(i=n-1;i>=0;i--)  sa[--wsf[wv[i]]]=y[i];
        t=x;
        x=y;
        y=t;
        x[sa[0]]=0;
        for(i=1,p=1;i<n;i++)
        x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
    }
}
void getheight(int *r,int n)
{
    int i,j,k=0;
    for(i=1;i<=n;i++)  rank[sa[i]]=i;
    for(i=0;i<n;i++)
    {
        if(k)
        k--;
        else
        k=0;
        j=sa[rank[i]-1];
        while(r[i+k]==r[j+k])
        k++;
        height[rank[i]]=k;
    }
}
int deal(int n,int p)
{
    int minx=sa[0],maxx1=sa[0];
    for(int i=0;i<=n;i++)
    {
        if(height[i]>=p)
        {
            if(minx>sa[i])
            minx=sa[i];
            if(maxx1<sa[i])
            maxx1=sa[i];
            if(maxx1-minx>p)
            return 1;
        } 
        else
        minx=maxx1=sa[i];
    }
    return 0;
}
int main()
{
    int n;
    while(scanf("%d",&n)>0&&n)
    {
        for(int i=0;i<n;i++)
        scanf("%d",&s[i]);
        for(int i=0;i<n-1;i++)
        {
            s[i]=s[i+1]-s[i]+90;              //这里要注意,题目相当于把数据进行平移了,避免了“变调”的影响 
        }
        n--;
        s[n]=0;
        getsa(s,sa,n+1,200);
        getheight(s,n);
        int left=0,right=n,mid,coun=0;
        while(left<=right)                              //二分处理 
        {
            mid=(left+right)/2;
            if(deal(n,mid))
            {
                if(coun<mid)
                coun=mid;
                left=mid+1;
            }
            else  right=mid-1;
        }
        if(coun<4) coun=0;                 //大于5个字符的情况下,合适 
        else
        coun++;                   
        printf("%d\n",coun);
    }
    return 0;
}
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值