最长重复子串

思路:使用后缀数组解决

分析:

1、由于要求最长公共子序列,则需要找到字符串的所有子串,即通过产生字符串的后缀数组实现。

2、由于要求最长的重复子串,则需要对所有子串进行排序,这样可以把相同的字符串排在一起

3、比较相邻字符串,找出两个子串中,相同的字符的个数。

注意,对于一个子串,一个与其重复最多的字符串肯定是紧挨着自己的两个字符串。

步骤:

      1、对待处理的字符串产生后缀数组

      2、对后缀数组排序

      3、依次检测相邻两个后缀的公共长度

      4、取出最大公共长度的前缀

举例:输入字符串 banana

1、字符串产生的后缀数组:
    a[0]:banana
    a[1]:anana
    a[2]:nana
    a[3]:ana
    a[4]:na
    a[5]:a

2、对后缀数组进行快速排序,以将后缀相近的(变位词)子串集中在一起

    a[0]:a
    a[1]:ana
    a[2]:anana
    a[3]:banana
    a[4]:na
    a[5]:nana

之后可以依次检测相邻两个后缀的公共长度并取出最大公共的前缀

#include <iostream>  
#include <string>  
#include <vector>
#include <algorithm>
//#include "Customer.h"

using namespace std;


int mycmp(const void *p1, const void *p2)
{
	return strcmp(*(char**)p1, *(char**)p2);
}

int getLen(char *p, char *q)
{
	int ret = 0;
	while ( *p && *p++ == *q++)
		++ret;
	return ret;
}
//最长重复子串,后缀数组
int getMaxRepeatSubStr(string str)
{
	char *s = new char[str.length()+1];
	for (int i = 0; i < str.length(); i++)
		s[i] = str[i];
	s[str.length()] = '\0';

	int len = str.length();
	char **suffix = new char*[len];
	for (int i = 0; i < len; i++)
		suffix[i] = s + i;
	qsort(suffix, len, sizeof(char*), mycmp);
	int maxlen = 0;
	for (int i = 0; i < len - 1; i++)
	{
		int tmp = getLen(suffix[i], suffix[i + 1]);
		if (tmp>maxlen)
			maxlen = tmp;
	}
	delete s;
	delete suffix;

	return maxlen;
}

int main()
{
	string str;
	while (cin >> str)
	{
		getMaxRepeatSubStr(str);
	}
	return 0;
}


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值