重复子串问题(二):求一个字符串中连续出现次数最多的子字符串

问题:求一个字符串中连续出现的次数最多的子串。例如字符串“abababc”,最多连续出现的为ab,连续出现三次。
要和求一个字符串中的最长重复子串区分开来,还是上面的字符串,那么最长的重复子串为abab。
两个题目的解法有些类似,都用到了后缀数组这个数据结构。求一个字符串中连续出现的次数最多的子串,首先生成后缀数组例如上面的字符串为:
abababc
bababc
ababc
babc
abc
bc
c
可以看出第一个后缀数组和第三个后缀数组的起始都为ab,第5个后缀数组也为ab。
可以看出规律来,一个字符串s,如果第一次出现在后缀数组i的前面,那么如果它重复出现,
下一次出现应该在第i+len(s)个后缀数组的前面。这个规律也不难看出。那么从头到尾按照这个规律搜索下不难得出结果。

方法一:利用后缀数组

#include<iostream>
#include<stdio.h>

using namespace std;

int con_substr(char *str,char **ret)
{
    int max_time=0; //连续出现的最多次数
    int ret_len=0;  //连续出现的字符串的长度
    char *addr=NULL;//连续出现字符串的起始地址

    int len=strlen(str);
    char **a=(char **)malloc(sizeof(char*)*len);

    //生成后缀数组
    for(int i=0;i<len;i++)
        a[i]=&str[i];
    //重复字符串的长度为从1到(len+1)/2
    for(int i=1;i<=(len+1)/2;i++)
    {
        //如果重复字符串的长度为i时,如果连续出现,那么第j和第j+i个后缀数组前面为重复的字符串
        for(int j=0;j+i<len;j+=i)
        {
            int count=1;
            int k=j;
            while(k+i<len && strncmp(a[k],a[k+i],i)==0)
            {
                count++;
                k+=i;
            }
            //for(int k=j;k+i<len;k+=i)
            //{
            //  if(strncmp(a[k],a[k+i],i)==0)
            //      count++;
            //}

            if(count>max_time)
            {
                max_time=count;
                ret_len=i;
                addr=a[k];
            }
        }

    }
    *ret=new char[ret_len+1];
    strncpy(*ret,addr,ret_len); 
    (*ret)[ret_len]='\0';
    return max_time;
}

int main()
{
     char str[] = "abcabcabcabcabcabbbb";  
     char *ret = NULL;  
     int time = con_substr(str, &ret);  
     printf("%s occuers %d times\n", ret, time);

}

方法二:利用string类方法实现

#include<iostream>
#include<string>
#include<vector>
using namespace std;

pair<int,string> con_str(const string &str)
{
    vector<string> substrs;
    int maxcount=1,count=1;
    string substr;
    int i,len=str.size();
    for(i=0;i<len;i++)
        substrs.push_back(str.substr(i,len-i));
    for(int i=0;i<len;i++)
        for(int j=i+1;j<len;j++)
        {
            count=1;
            if(substrs[i].substr(0,j-i) == substrs[j].substr(0,j-i))
            {
                count++;
                for(int k=j+(j-i);k<len;k+=j-i)
                    if(substrs[k].substr(0,j-i) == substrs[i].substr(0,j-i))
                    {
                        count++;
                    }
                    else
                        break;
                if(count>maxcount)
                {
                    maxcount=count;
                    substr=substrs[i].substr(0,j-i);
                }
            }
        }
    return make_pair(maxcount,substr);
}

int main()
{
    string str;
    pair<int,string> rs;
    cout<<"Input a string:"<<endl;
    while(cin>>str)
    {
        rs=con_str(str);
        cout<<rs.first<<":"<<rs.second<<endl;

        cout<<"Input a string:"<<endl;
    }
}
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值