求一个字符串中连续出现的次数最多的子串。例如字符串“abababc”,最多连续出现的为ab,连续出现三次。求一个字符串中连续出现的次数最多的子串,首先生成后缀数组例如上面的字符串为:
abababc
bababc
ababc
babc
abc
bc
c
可以看出第一个后缀数组和第三个后缀数组的起始都为ab,第5个后缀数组也为ab。可以看出规律来,一个字符串s,如果第一次出现在后缀数组i的前面,那么如果它重复出现,下一次出现应该在第i+len(s)个后缀数组的前面。这个规律也不难看出。那么从头到尾按照这个规律搜索下不难得出结果。下面是代码:
#include<iostream>
#include<string>
#include<vector>
using namespace std;
pair<int, string> mostConSubstr(const string & str);
int main()
{
string s = "abababa";
pair<int,string> p;
p = mostConSubstr(s);
cout << p.first << " " << p.second << endl;
return 0;
}
pair<int, string> mostConSubstr(const string & str)
{
int maxNum = 1;
int count = 1;
int len = str.size();
int i;
string substr;
vector<string> substrs;
for(i = 0; i < len; i++)
substrs.push_back(str.substr(i,len - i));
for(i = 1; i <= len/2; i++)
{
for(int j = 0; j+i < len; j++)
{
int k = j;
while(k+i < len &&
substrs[k].substr(0,i) == substrs[k+i].substr(0,i))
{
count ++;
k += i;
}
if(count > maxNum)
{
maxNum = count;
substr = substrs[k].substr(0,i);
}
count = 1;
}
}
return make_pair(maxNum,substr);
}