第1关:实现朴素的字符串匹配
任务描述
本关任务是实现函数int FindSubStr(char* t, char* p)
。
相关知识
在一个长字符串中寻找一个短字符串出现的位置,这是字符串匹配问题。
例如:长字符串是 “string” ,短字符串是 “ring” ,那么短字符串在长字符串中出现的位置是 2 ,即 “ring” 在 “string” 中出现的开始位置是 2 。
编程要求
本关的编程任务是补全 step1/mystr.cpp 文件中的FindSubStr
函数,以实现朴素的字符串匹配。
- 具体请参见后续测试样例。
本关涉及的代码文件 mystr.cpp 的代码框架如下:
int FindSubStr(char* t, char* p)
/*
从字符串t查找子字符串p。
字符串以数值结尾,例如p="str",那么p[0]='s',p[1]='t',p[2]='r',p[3]=0。
采用朴素的匹配算法,返回子字符串第一次出现的位置,例如t="string ring",p="ring",则返回2。
若没有找到,则返回-1。
*/
{
// 请在此添加代码,补全函数FindSubStr
/********** Begin *********/
/********** End **********/
}
评测说明
本关的测试文件是 step1/Main.cpp ,测试过程如下:
- 平台编译 step1/Main.cpp ,然后链接相关程序库并生成 exe 可执行文件;
- 平台运行该 exe 可执行文件,并以标准输入方式提供测试输入;
- 平台获取该 exe 可执行文件的输出,然后将其与预期输出对比,如果一致则测试通过;否则测试失败。
以下是平台对 step1/Main.cpp 的样例测试集:
样例输入: string
tri
样例输出: Location: 1
开始你的任务吧,祝你成功!
/*************************************************************
date: April 2009
copyright: Zhu En
DO NOT distribute this code.
**************************************************************/
int FindSubStr(char* t, char* p)
/*
从字符串t查找子字符串p。
字符串以数值结尾,例如p="str",那么p[0]='s',p[1]='t',p[2]='r',p[3]=0。
采用朴素的匹配算法。
返回子字符串第一次出现的位置,例如t="string ring",p="ring",则返回2。
若没有找到,则返回-1。
*/
{
// 请在此添加代码,补全函数FindSubStr
/********** Begin *********/
char* s = t;
char* q = p;
int i = 0;
while(*s != 0){
if(*s != *p){
s++;i++;
continue;
}
while(*s == *q){
s++;q++;
}
if(*q == 0)return i;
else q = p;
}
return -1;
/********** End **********/
}
第2关:实现KMP字符串匹配
任务描述
本关的编程任务是补全 step2/kmp.cpp 文件中的KmpGenNext
函数,以实现 KMP 字符串匹配。该函数生成给定字符串的next
数组。
相关知识
第 1 关中实现的朴素的字符串匹配算法在实际应用系统中效率低,而 KMP 字符串匹配算法可以实现高效的匹配。
假设长字符串为t
,短字符串为p
。为了进行 KMP 匹配,首先需要计算字符串p
的next
数组,后面实现了计算该数组的函数void KmpGenNext(char* p, int* next)
。对于 “abcabcab” ,计算出的next
数组如下图:
其中:next[i]
给出如下信息:从左到右将p
的字符与t
的字符进行比对时,若在p
的i
号位置出现不匹配,就将字符串p
相对t
右移i-next[i]
位;若next[i]>=0
,则右移后比对位置从next[i]
号位置开始,否则从0
号位置开始。下图 1 给出了一个匹配示例:
本关涉及两个函数:
void KmpGenNext(char* p, int* next)
// 生成p的next数组, next数组长度大于等于字符串p的长度加1。
int KmpFindSubWithNext(char* t, char* p, int* next)
// 从t中查找子串p的第一次出现的位置。
// 若找到,返回出现的位置,否则返回-1。
编程要求
本关的编程任务是补全 step2/kmp.cpp 文件中的KmpGenNext
函数,以实现 KMP 字符串匹配。该函数生成给定字符串的next
数组,生成算法请你查阅相关资料。
- 具体请参见后续测试样例。
本关涉及的代码文件 kmp.cpp 的代码框架如下:
#include <stdio.h>
#include <stdlib.h>
#include "kmp.h"
///
void KmpGenNext(char* p, int* next)
// 生成p的next数组, next数组长度大于等于字符串p的长度加1
{
// 请在此添加代码,补全函数KmpGenNext
/********** Begin *********/
/********** End **********/
}
int KmpFindSubWithNext(char* t, char* p, int* next)
// 从t中查找子串p的第一次出现的位置
// 若找到,返回出现的位置,否则返回-1
{
int i=0, j=0;
while(p[i]!=0 && t[j]!=0) {
if(p[i]==t[j]) {
i++;
j++;
}
else if (next[i]>=0) {
i = next[i];
}
else {
i=0;
j++;
}
}
if(p[i]==0) return j-i; //found
else return -1; //not found
}
评测说明
本关的测试文件是 step2/Main.cpp ,测试过程如下:
- 平台编译 step2/Main.cpp ,然后链接相关程序库并生成 exe 可执行文件;
- 平台运行该 exe 可执行文件,并以标准输入方式提供测试输入;
- 平台获取该 exe 可执行文件的输出,然后将其与预期输出对比,如果一致则测试通过;否则测试失败。
输入输出格式: 输入格式: 第一行输入母串 第二行输入子串
输出格式: 输出Location
: #
,其中#是子串在母串中的位置编号
以下是平台对 step2/Main.cpp 的样例测试集: 样例输入: stringabcedf1stringabcdef2stringabcdef3stringabcdef4stringabcdef5stringabcdef6stringabcdef7
stringabcdef7
样例输出: Location: 78
开始你的任务吧,祝你成功!
/*************************************************************
date:
copyright: Zhu En
DO NOT distribute this code without my permission.
**************************************************************/
//字符串 实现文件
//
#include <stdio.h>
#include <stdlib.h>
#include "kmp.h"
void KmpGenNext(char* p, int* next)
//生成p的next数组, next数组长度大于等于字符串p的长度加1
{
next[0]= -1;
int k= -1;
for (int i=1; p[i-1]!=0; i++)
{
while(k>=0&&p[k]!=p[i-1])
{
k=next[k];
k=k+1;
if (p[i]==p[k])
{
next[i]=next[k];
}
else
{
next[i]=k;
}
}
}
}
int KmpFindSubWithNext(char* t, char* p, int* next)
//从t中查找子串p的第一次出现的位置
//若找到,返回出现的位置,否则返回-1
{
int i=0, j=0;
while(p[i]!=0 && t[j]!=0)
{
if(p[i]==t[j])
{
i++;
j++;
}
else if (next[i]>=0)
{
i = next[i];
}
else
{
i=0;
j++;
}
}
if(p[i]==0)
{
return j-i; //found
}
else
{
return -1; //not found
}
}