串(String)是由零个或多个字符组成的有限序列,是一种常见的数据结构。
字符串可以表示文本或者任意字符的序列,可以包含字母、数字、特殊符号等。在计算机中,字符串是一种基本的数据类型,常常用来表示文本数据或者存储和处理字符相关的信息。
字符串可以通过数组、链表或者其他数据结构来实现。常见的字符串操作包括:
- 长度(Length):获取字符串中字符的个数。
- 连接(Concatenation):将两个字符串合并成一个字符串。
- 比较(Comparison):比较两个字符串是否相等,或者判断字符串的大小关系。
- 截取(Substring):从字符串中获取一部分连续的字符。
- 查找(Search):查找指定字符或者子串在字符串中的位置。
- 替换(Replace):将字符串中的某个字符或者子串替换为另一个字符或者子串。
- 插入(Insertion):在指定位置插入一个字符或者子串。
- 删除(Deletion):删除指定位置的字符或者子串。
字符串的应用非常广泛,例如在文本编辑、搜索引擎、编译器等各种软件中都会用到字符串的处理和操作。对于算法和数据结构来说,字符串的处理也是一个重要的部分,如字符串匹配算法、字符串排序、字符串压缩等。
在代码中,首先定义了一些宏和类型以及相关的常量。宏定义了OK、ERROR和OVERFLOW三个状态,用于表示函数执行的结果。类型Status被定义为int类型,用于表示函数的返回值。常量MAXSTRLEN定义了字符串的最大长度为255,SString类型是一个字符数组,用于存储字符串,其中0号单元存放串的长度。
接下来,代码中定义了StrAssign函数,用于生成一个与给定字符串等值的串。在函数内部,首先判断给定字符串的长度是否超过最大长度,若是,则返回ERROR状态。否则,将给定字符串的长度赋值给T[0],然后使用循环将每个字符逐个赋值给T数组中的对应位置。
在代码的后面部分,定义了get_nextval函数(用于计算模式串T的next函数修正值)和Index_KMP函数(用于在主串S中查找子串T的位置)。
在主函数main中,首先定义了两个SString类型变量S和T,并分别使用StrAssign函数将字符串赋值给它们。接下来,使用new关键字动态创建了一个长度为T[0]+1的int型数组p,并调用get_nextval函数计算模式串T的next数组。最后,调用Index_KMP函数,在主串S中从第1个字符开始查找子串T的位置,并输出结果。
这段代码是实现字符串匹配的KMP算法。下面是代码的分析:
- 定义了字符串类型SString和字符串赋值函数StrAssign:
typedef char SString[MAXSTRLEN+1]; // 字符串类型
Status StrAssign(SString T, char *chars) { // 生成一个其值等于chars的串T
int i;
if (strlen(chars) > MAXSTRLEN)
return ERROR;
else {
T[0] = strlen(chars);
for (i = 1; i <= T[0]; i++)
T[i] = *(chars + i - 1);
return OK;
}
}
- 实现了计算修正值的函数get_nextval:
void get_nextval(SString T, int nextval[]) { // 求模式串T的next函数修正值并存入数组nextval
int i = 1, j = 0;
nextval[1] = 0;
while (i < T[0]) {
if (j == 0 || T[i] == T[j]) {
++i;
++j;
if (T[i] != T[j])
nextval[i] = j;
else
nextval[i] = nextval[j];
} else {
j = nextval[j];
}
}
}
- 实现了KMP算法的字符串匹配函数Index_KMP:
int Index_KMP(SString S, SString T, int pos, int next[]) {
int i = pos, j = 1;
while (i <= S[0] && j <= T[0]) {
if (j == 0 || S[i] == T[j]) {
++i;
++j;
} else {
j = next[j];
}
}
if (j > T[0]) // 匹配成功
return i - T[0];
else
return 0;
}
- 主函数中演示了使用KMP算法找到主串和子串首次匹配的位置:
int main() {
SString S;
StrAssign(S, "babaaaabbaba");
SString T;
StrAssign(T, "abb");
int *p = new int[T[0] + 1]; // 生成T的next数组
get_nextval(T, p);
cout << "主串和子串在第" << Index_KMP(S, T, 1, p) << "个字符处首次匹配\n";
return 0;
}
在主函数中,定义了一个主串S和一个子串T,然后生成子串T的next数组,最后使用KMP算法在主串S中找到子串T首次匹配的位置。
完整代码:
/***字符串匹配算法***/
#include<cstring>
#include<iostream>
using namespace std;
#define OK 1
#define ERROR 0
#define OVERFLOW -2
typedef int Status;
#define MAXSTRLEN 255 //用户可在255以内定义最长串长
typedef char SString[MAXSTRLEN+1]; //0号单元存放串的长度
Status StrAssign(SString T, char *chars) { //生成一个其值等于chars的串T
int i;
if (strlen(chars) > MAXSTRLEN)
return ERROR;
else {
T[0] = strlen(chars);
for (i = 1; i <= T[0]; i++)
T[i] = *(chars + i - 1);
return OK;
}
}
//算法4.4 计算next函数修正值
void get_nextval(SString T, int nextval[])
{ // 求模式串T的next函数修正值并存入数组nextval
int i = 1, j = 0;
nextval[1] = 0;
while (i < T[0])
if (j == 0 || T[i] == T[j])
{
++i;
++j;
if (T[i] != T[j])
nextval[i] = j;
else
nextval[i] = nextval[j];
} else
j = nextval[j];
}//get_nextval
//算法4.2 KMP算法
int Index_KMP(SString S, SString T, int pos, int next[])
{ // 利用模式串T的next函数求T在主串S中第pos个字符之后的位置的KMP算法
//其中,T非空,1≤pos≤StrLength(S)
int i = pos, j = 1;
while (i <= S[0] && j <= T[0])
if (j == 0 || S[i] == T[j]) // 继续比较后继字
{
++i;
++j;
}
else
j = next[j]; // 模式串向右移动
if (j > T[0]) // 匹配成功
return i - T[0];
else
return 0;
}//Index_KMP
int main()
{
SString S;
StrAssign(S,"babaaaabbaba") ;
SString T;
StrAssign(T,"abb") ;
int *p = new int[T[0]+1]; // 生成T的next数组
get_nextval(T,p);
cout<<"主串和子串在第"<<Index_KMP(S,T,1,p)<<"个字符处首次匹配\n";
return 0;
}