hdu 3518 Boring counting 后缀数组LCP

题目链接

题意:给定长度为n(n <= 1000)的只含小写字母的字符串,问字符串子串不重叠出现最少两次的不同子串个数;

input:

aaaa
ababcabb
aaaaaa
#
output
2
3
3
 
思路:套用后缀数组求解出sa数组和height数组,之后枚举后缀的公共前缀长度i,由于不能重叠,所以计数的是相邻height不满足LCP >= i的。
写写对后缀数组倍增算法的理解:
1.如果要sa数组对应的值也是1~n就需要在最后加上一个最小的且不出现的字符'#',里面y[]是利用sa数组对第二个关键字重新排序,由于使用的是基数排序,所以当前一次长度为k时相同的子串,在下一次长为2*k时,y排在前面的下标得到的sa是要小的;
 
2.在getHeight函数中,rk[i]:后缀i在sa中的排名;height[i]表示s[i] 与s[i-1]的公共前缀长度。且s[i] 与 s[j] 的值为 RMQ(min{ height[i+1]...height[j] }),加上i < j;同时可以借助辅助数组h[i] = height[rk[i]],得到h[i] >= h[i-1] + 1;这样使用递推就可以将求解height[]的时间复杂度降为O(n);
 
注意:在输入串s末尾加入字符之后 n = strlen(s) + 1;在求解rk[]时,sa[i]是从1开始的,sa[0] = '$';之后的求解height[]还是从0开始;细节
 
#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
const int MAXN = 1007;
char s[MAXN];
int sa[MAXN],t[MAXN],t2[MAXN],c[MAXN],n;
void build_sa(int m,int n) // m为字符ASCII码的最大值+1;n = strlen(s) + 1;
{
    int i,*x = t, *y = t2;
    for(i = 0;i < m; i++) c[i] = 0;
    for(i = 0;i < n; i++) c[x[i] = s[i]]++;
    for(i = 1;i < m; i++) c[i] += c[i-1];
    for(i = n - 1;i >= 0; i--) sa[--c[x[i]]] = i;
    for(int k = 1;k <= n;k <<= 1){
        int p = 0;
        for(i = n - k;i < n;i++) y[p++] = i;
        for(i = 0;i < n;i++) if(sa[i] >= k) y[p++] = sa[i] - k;

        for(i = 0;i < m;i++) c[i] = 0;
        for(i = 0;i < n;i++) c[x[y[i]]]++;
        for(i = 1;i < m;i++) c[i] += c[i-1];
        for(i = n - 1;i >= 0;i--) sa[--c[x[y[i]]]] = y[i];

        swap(x,y);
        x[sa[0]] = 0;// 将字符彻底转变为序号;
        for(i = 1,p = 1;i < n;i++)
            x[sa[i]] = y[sa[i]] == y[sa[i-1]] && y[sa[i]+k] == y[sa[i-1]+k]?p-1:p++;
        if(p >= n) break;
        m = p;
    }
}
int rk[MAXN],height[MAXN];
void getHeight()
{
    int i,j,k = 0;
    for(i = 1;i <= n;i++) rk[sa[i]] = i; // rk[i]:后缀i在sa[]中的下标,从1开始
    for(i = 0;i < n;i++){
        if(k) k--;
        if(rk[i] == 0) continue;
        j = sa[rk[i] - 1];
        while(i+k<n && j+k<n && s[i+k] == s[j+k]) k++;
        height[rk[i]] = k; // h[i] = height[rk[i]]; h[i] >= h[i-1] - 1;
    }
}
int main()
{
    while(scanf("%s",s) == 1 && s[0] != '#'){
        ll ans = 0;
        n = strlen(s);
        s[n] = '#';
        build_sa('z'+1,n+1);
        getHeight();
        for(int i = 1;i <= n/2; i++){
            int l = n+1,r = -1;
            for(int j = 2;j <= n;j++){
                if(height[j] >= i){// 递推出最左最优的l,r;
                    r = max(r,max(sa[j],sa[j-1]));
                    l = min(l,min(sa[j],sa[j-1]));
                }
                else{
                    if(r-l >= i) ans++;
                    r = -1,l = n+1;
                }
            }
            if(r-l >= i) ans++;
        }
        printf("%I64d\n",ans);
    }
    return 0;
}

 

 

 

转载于:https://www.cnblogs.com/hxer/p/5376537.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
资源包主要包含以下内容: ASP项目源码:每个资源包中都包含完整的ASP项目源码,这些源码采用了经典的ASP技术开发,结构清晰、注释详细,帮助用户轻松理解整个项目的逻辑和实现方式。通过这些源码,用户可以学习到ASP的基本语法、服务器端脚本编写方法、数据库操作、用户权限管理等关键技术。 数据库设计文件:为了方便用户更好地理解系统的后台逻辑,每个项目中都附带了完整的数据库设计文件。这些文件通常包括数据库结构图、数据表设计文档,以及示例数据SQL脚本。用户可以通过这些文件快速搭建项目所需的数据库环境,并了解各个数据表之间的关系和作用。 详细的开发文档:每个资源包都附有详细的开发文档,文档内容包括项目背景介绍、功能模块说明、系统流程图、用户界面设计以及关键代码解析等。这些文档为用户提供了深入的学习材料,使得即便是从零开始的开发者也能逐步掌握项目开发的全过程。 项目演示与使用指南:为帮助用户更好地理解和使用这些ASP项目,每个资源包中都包含项目的演示文件和使用指南。演示文件通常以视频或图文形式展示项目的主要功能和操作流程,使用指南则详细说明了如何配置开发环境、部署项目以及常见问题的解决方法。 毕业设计参考:对于正在准备毕业设计的学生来说,这些资源包是绝佳的参考材料。每个项目不仅功能完善、结构清晰,还符合常见的毕业设计要求和标准。通过这些项目,学生可以学习到如何从零开始构建一个完整的Web系统,并积累丰富的项目经验。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值