hiho一下第三周 "KMP"算法

最新推荐文章于 2021-12-05 09:22:11 发布

KangRoger

最新推荐文章于 2021-12-05 09:22:11 发布

阅读量3.1k

点赞数

分类专栏：面试笔试题目

本文链接：https://blog.csdn.net/KangRoger/article/details/38024843

版权

面试笔试题目专栏收录该内容

32 篇文章 0 订阅

订阅专栏

之前写过KMP算法，在多益机试题目--字符串匹配的变形中，这次稍微有点改动，不是查找存不存在子串，而是找存在子串的数目。这个数目还有点怪，就是重复的也算在内。就像模式串ADA，原串ADADADA，存在三次，明显有重叠，因此next函数就要多算一位。模式串长度为L，那么next函数不是计算到next[L-1]，而是计算到Next[L]。

题目如下：

小Hi和小Ho是一对好朋友，出生在信息化社会的他们对编程产生了莫大的兴趣，他们约定好互相帮助，在编程的学习道路上一同前进。

这一天，他们遇到了一只河蟹，于是河蟹就向小Hi和小Ho提出了那个经典的问题：“小Hi和小Ho，你们能不能够判断一段文字（原串）里面是不是存在那么一些……特殊……的文字（模式串）？”

小Hi和小Ho仔细思考了一下，觉得只能想到很简单的做法，但是又觉得既然河蟹先生这么说了，就肯定不会这么容易的让他们回答了，于是他们只能说道：“抱歉，河蟹先生，我们只能想到时间复杂度为（文本长度 * 特殊文字总长度）的方法，即对于每个模式串分开判断，然后依次枚举起始位置并检查是否能够匹配，但是这不是您想要的方法是吧？”

河蟹点了点头，说道：”看来你们的水平还有待提高，这样吧，如果我说只有一个特殊文字，你能不能做到呢？“

小Ho这时候还有点晕晕乎乎的，但是小Hi很快开口道：”我知道！这就是一个很经典的模式匹配问题！可以使用KMP算法进行求解！“

河蟹满意的点了点头，对小Hi说道：”既然你知道就好办了，你去把小Ho教会，下周我有重要的任务交给你们！“

”保证完成任务！”小Hi点头道。

提示一：KMP的思路

提示二：NEXT数组的使用

提示三：如何求解NEXT数组

输入

第一行一个整数N，表示测试数据组数。

接下来的N*2行，每两行表示一个测试数据。在每一个测试数据中，第一行为模式串，由不超过10^4个大写字母组成，第二行为原串，由不超过10^6个大写字母组成。

其中N<=20

输出

对于每一个测试数据，按照它们在输入中出现的顺序输出一行Ans，表示模式串在原串中出现的次数。

样例输入

5
HA
HAHAHA
WQN
WQN
ADA
ADADADA
BABABB
BABABABABABABABABB
DAD
ADDAADAADDAAADAAD

样例输出

源代码：

#include<iostream>  
#include<cstring> 
#include<string>
using namespace std;  
int Next[10001];
//求KMP的Next数组  
void GetNext(const string& p)  
{  
    int len=p.size();  
    int i=0;  
    int j=-1;  
    Next[i]=j;  
    while(i<len)  
    {  
        if(j==-1||p.at(i)==p.at(j))  
        {  
            i++;  
            j++;  
            if(i==len||p.at(i)!=p.at(j))//不允许出现P[i]==P[next[i]]  
                Next[i]=j;  
            else  
                Next[i]=Next[j];  
        }  
        else  
        {  
            j=Next[j];  
        }  
    }  
      
} 


//S为母串，p为匹配子串，如果匹配返回匹配位置，否则返回-1  
int KMPSearch(const string& s,const string& p)  
{  
    unsigned int Slen=s.size();  
	unsigned int Plen=p.size();
    //int *Next=new int[Plen];//Next数组存储位置  
  
    GetNext(p);//求得Next数组  
  
    unsigned int i=0;//在S串中的下标  
    unsigned int j=0;//在P串中的下标  
	unsigned int count=0;//匹配串出现的次数
    while(i<Slen)  
    {  
        if(j==-1||s.at(i)==p.at(j))  
        {  
            i++;  
            j++;  
        }  
        else  if(j<Plen)
            j=Next[j];  
		if(j==Plen)
		{
			count++;
			j=Next[Plen];
		}
    }   
    return count;
}

int main()  
{  
    string str1;  
    string str2;  
	int n;
	cin>>n;
	for(int i=0;i<n;i++)
	{
		cin>>str2;
		cin>>str1; 
		 
		int pos=KMPSearch(str1,str2);  
		cout<<pos<<endl; 
	
	}
   
    return 0;  
}