数据结构与算法 - 字符串匹配

第1关:实现朴素的字符串匹配

任务描述

本关任务是实现函数int FindSubStr(char* t, char* p)

相关知识

在一个长字符串中寻找一个短字符串出现的位置,这是字符串匹配问题。

例如:长字符串是 “string” ,短字符串是 “ring” ,那么短字符串在长字符串中出现的位置是 2 ,即 “ring” 在 “string” 中出现的开始位置是 2 。

编程要求

本关的编程任务是补全 step1/mystr.cpp 文件中的FindSubStr函数,以实现朴素的字符串匹配。

  • 具体请参见后续测试样例。

本关涉及的代码文件 mystr.cpp 的代码框架如下:

 
  1. int FindSubStr(char* t, char* p)
  2. /*
  3. 从字符串t查找子字符串p。
  4. 字符串以数值结尾,例如p="str",那么p[0]='s',p[1]='t',p[2]='r',p[3]=0。
  5. 采用朴素的匹配算法,返回子字符串第一次出现的位置,例如t="string ring",p="ring",则返回2。
  6. 若没有找到,则返回-1。
  7. */
  8. {
  9. // 请在此添加代码,补全函数FindSubStr
  10. /********** Begin *********/
  11. /********** End **********/
  12. }

评测说明

本关的测试文件是 step1/Main.cpp ,测试过程如下:

  1. 平台编译 step1/Main.cpp ,然后链接相关程序库并生成 exe 可执行文件;
  2. 平台运行该 exe 可执行文件,并以标准输入方式提供测试输入;
  3. 平台获取该 exe 可执行文件的输出,然后将其与预期输出对比,如果一致则测试通过;否则测试失败。

以下是平台对 step1/Main.cpp 的样例测试集:

样例输入: string tri 样例输出: Location: 1


开始你的任务吧,祝你成功!

/*************************************************************
    date: April 2009
    copyright: Zhu En
    DO NOT distribute this code.
**************************************************************/

int FindSubStr(char* t, char* p)
/*
从字符串t查找子字符串p。
字符串以数值结尾,例如p="str",那么p[0]='s',p[1]='t',p[2]='r',p[3]=0。
采用朴素的匹配算法。
返回子字符串第一次出现的位置,例如t="string ring",p="ring",则返回2。
若没有找到,则返回-1。
*/
{
    // 请在此添加代码,补全函数FindSubStr
    /********** Begin *********/
    char* s = t;
    char* q = p;
    int i = 0;
    while(*s != 0){
        if(*s != *p){
            s++;i++;
            continue;
        }
        while(*s == *q){
            s++;q++;
        }
        if(*q == 0)return i;
        else q = p;
    }
    return -1;

    /********** End **********/
}

第2关:实现KMP字符串匹配

任务描述

本关的编程任务是补全 step2/kmp.cpp 文件中的KmpGenNext函数,以实现 KMP 字符串匹配。该函数生成给定字符串的next数组。

相关知识

第 1 关中实现的朴素的字符串匹配算法在实际应用系统中效率低,而 KMP 字符串匹配算法可以实现高效的匹配。

假设长字符串为t,短字符串为p。为了进行 KMP 匹配,首先需要计算字符串pnext数组,后面实现了计算该数组的函数void KmpGenNext(char* p, int* next)。对于 “abcabcab” ,计算出的next数组如下图:

其中:next[i]给出如下信息:从左到右将p的字符与t的字符进行比对时,若在pi号位置出现不匹配,就将字符串p相对t右移i-next[i]位;若next[i]>=0,则右移后比对位置从next[i]号位置开始,否则从0号位置开始。下图 1 给出了一个匹配示例:

本关涉及两个函数

 
  1. void KmpGenNext(char* p, int* next)
  2. // 生成p的next数组, next数组长度大于等于字符串p的长度加1。
 
  1. int KmpFindSubWithNext(char* t, char* p, int* next)
  2. // 从t中查找子串p的第一次出现的位置。
  3. // 若找到,返回出现的位置,否则返回-1。

编程要求

本关的编程任务是补全 step2/kmp.cpp 文件中的KmpGenNext函数,以实现 KMP 字符串匹配。该函数生成给定字符串的next数组,生成算法请你查阅相关资料。

  • 具体请参见后续测试样例。

本关涉及的代码文件 kmp.cpp 的代码框架如下:

 
  1. #include <stdio.h>
  2. #include <stdlib.h>
  3. #include "kmp.h"
  4. ///
  5. void KmpGenNext(char* p, int* next)
  6. // 生成p的next数组, next数组长度大于等于字符串p的长度加1
  7. {
  8. // 请在此添加代码,补全函数KmpGenNext
  9. /********** Begin *********/
  10. /********** End **********/
  11. }
  12. int KmpFindSubWithNext(char* t, char* p, int* next)
  13. // 从t中查找子串p的第一次出现的位置
  14. // 若找到,返回出现的位置,否则返回-1
  15. {
  16. int i=0, j=0;
  17. while(p[i]!=0 && t[j]!=0) {
  18. if(p[i]==t[j]) {
  19. i++;
  20. j++;
  21. }
  22. else if (next[i]>=0) {
  23. i = next[i];
  24. }
  25. else {
  26. i=0;
  27. j++;
  28. }
  29. }
  30. if(p[i]==0) return j-i; //found
  31. else return -1; //not found
  32. }

评测说明

本关的测试文件是 step2/Main.cpp ,测试过程如下:

  1. 平台编译 step2/Main.cpp ,然后链接相关程序库并生成 exe 可执行文件;
  2. 平台运行该 exe 可执行文件,并以标准输入方式提供测试输入;
  3. 平台获取该 exe 可执行文件的输出,然后将其与预期输出对比,如果一致则测试通过;否则测试失败。

输入输出格式: 输入格式: 第一行输入母串 第二行输入子串

输出格式: 输出Location: #,其中#是子串在母串中的位置编号

以下是平台对 step2/Main.cpp 的样例测试集: 样例输入: stringabcedf1stringabcdef2stringabcdef3stringabcdef4stringabcdef5stringabcdef6stringabcdef7 stringabcdef7

样例输出: Location: 78


开始你的任务吧,祝你成功!

/*************************************************************
    date: 
    copyright: Zhu En
    DO NOT distribute this code without my permission.
**************************************************************/
//字符串 实现文件
//
#include <stdio.h>
#include <stdlib.h>
#include "kmp.h"
void KmpGenNext(char* p, int* next)
//生成p的next数组, next数组长度大于等于字符串p的长度加1
{
    next[0]= -1;
    int k= -1;
    for (int i=1; p[i-1]!=0; i++) 
    {    
        while(k>=0&&p[k]!=p[i-1])   
  	{
   		k=next[k];
   		k=k+1; 
   		if (p[i]==p[k])  
   		{
    			next[i]=next[k];
   		}
     		else    
   		{
    			next[i]=k;
   		}
  	}
    }
}
int KmpFindSubWithNext(char* t, char* p, int* next)
//从t中查找子串p的第一次出现的位置
//若找到,返回出现的位置,否则返回-1
{
    int i=0, j=0;
    while(p[i]!=0 && t[j]!=0)    
    {
        if(p[i]==t[j])     
  	{ 
            i++;  
            j++; 
        }
        else  if (next[i]>=0) 
  	{
            i = next[i];
        }
        else  
  	{ 
            i=0;  
            j++; 
        }
    }
    if(p[i]==0)  
    {
  	return j-i; //found
    }
    else  
    {
  	return -1;  //not found
    }
}

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值