1.串是0个或多个字符组成的有限序列。
S = "S1S2S3Sn";
子串的第一个字符在主串中的序号成为子串在主串中的位置.
1)串的顺序存储结构:
在PASCAL,C,C++,java等语言中,串的存储和基本操作的实现都是采用顺序存储结构.
一般有三种方式表示串的长度:
用一个变量来表示串的长度;
用一个不会在串中出现的特殊字符表示串的终结,C++中采用'\0';
用数组的0号单元存放串的长度.
2)串的链接存储
1)非压缩形式:一个节点存储一个字符;
2)压缩形式:提高空间利用率,一个节点存储多个字符.这实质上是一种顺序与链接结合的结构 .
2.模式匹配:
朴素的模式匹配算法(BF算法):
// 子串在主串中的朴素模式匹配算法
// 基本思想:从主串的第一个字符开始,依次与子串第一个字符开始比较.如果比较到子串末尾均相等,返回比较位置.
// 否则,从主串第二个字符开始比较;若能够将子串所有字符比较完毕,则匹配成功,否则匹配失败。
// 伪代码
// 1)设置i,j分别为主串和子串的比较位置;
// 2)比较S[i],T[i],相等,比较下一个,否则;j置位开始位置,i到下一个字符
// 3) 若T中所有字符比较完毕,返回比较起始下表i;匹配失败,返回-1;
int BF(char S[], char T[])
{
int i = 0;
int j = 0;
int nStart = i;
while (S[i] != '\0' && T[j] != '\0')
{
if (S[i] == T[j])
{
i++;
j++;
}else
{
j = 0;
nStart++;
i = nStart;
}
}
if (T[j] == '\0')
{
return nStart;
}
return -1;
}
关于改进的模式匹配算法KMP请参照
点击打开链接