POJ 3693 Maximum repetition substring 后缀数组 + RMQ预处理

博客介绍了如何利用后缀数组和RMQ(Range Minimum Query)预处理来解决POJ 3693问题,即找出给定字符串中repetition number最大的子串,且当有多个答案时,输出字典序最小的那个。文中提到,对于repetition number为1的情况,只需找到字典序最小的字母。对于repetition number >= 2,通过枚举循环节长度和位置,计算最长公共前缀,结合后缀数组的字典序性质找出最优解。
摘要由CSDN通过智能技术生成

题目大意:

定义一个字符串的repetition number表示这个字符串某个重复出现的子串的出现次数, 每次出现不重合比如abababab是ab重复4次其repetition number是4, 而ababa包含两个有重叠的‘aba’, 只能算repetition number是1(1个‘ababa')

给出一个长度不超过100,000的字符串,求出这个字符串的所有子串中repetition number最大的子串,如果有多个输出字典序最小的那个


大致思路:

表示想了很久没有想到O(nlogn)的做法= =...不得不说这个题论文上的做法还是很巧妙的

首先有这样一个事实: 对于任何一个子串, repetition number >= 1, 所以对于repetition number为1的只需要找到字典序最小的那个字母即可, 那么我们只考虑repetition number >= 2的情况, 如果每一个循环节的长度为len, 那么在原字符串S中, S[i*len]与S[(i + 1)*len]一定会被包含在答案的子串当中那么枚举可能的答案的循环节的长度, 然后枚举可能的位置, 对于每一组可能被包含的位置S[i*len], S[(i + 1)*len]求出其对应后缀的最长公共前缀长度L, 则该循环节至少循环了L/len + 1次, 但是当L%len != 0时, 后面多余出来的部分(长度L%len的部分)可能和前面的拼凑成循环节, 于是对于位置i*len - (len - L % len)和(i + 1)*len - (len - L % len)求其后缀的最长公共前缀长度, 如果大于之前的结果,自然就说明从这个位置开始可以比之前多一个循环节, 于是这样枚举得到最多循环次数和循环长度之后利用后缀数组的字典序性质找到字典序最小的即可


代码如下:

Result  :  Accepted     Memory  :  11280 KB     Time  :  

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值