目录
一、串的定义
由零个或多个字符组成的有限序列
#define MAXLEN 50
typedef struct {
char ch[MAXLEN]; //每给分量存储的一个字符
int length; //串的实际长度
}SString;
串中任意多个连续的字符组成的子序列称为串的子串,包含含子串的串称为主串,
A='China Beijing' B='Beijing' C='China'
长度分别为13、7 、5,B和C是A的子串,B在A中的位置是7,C在A中的位置是1
长度是1开始的
注意:一个空格也是一个字符长度
*子串、非空子串、真子串、非空真子串,求数公式及例子
字串 | 非空子串 | 真子串 | 非空子串 |
举个栗子:
串 S = “database” 的非空子串数目为:( )
A、37
B、36
C、35
D、34
S=“database”,n=8,求非空子串,带入公式,
有重复的,减去重复项:对于第一个a来说,第二个、第三个a是重复的,也就是有两个重复项;
所以结果是 D, 36 - 2 = 34;
串 S = "www.88.com"的非空子串数目为:____。
数一数就知道 n 是多少了,n = 10,带入公式得
重复项:
对于第一个 w 来说,第二个、第三个 w 是重复的
对于第一个 . 来说, 第二个 . 是重复的
对于第一个 8 来说,第二个 8 是重复的对于第一个 ww 来说,第二个 ww 是重复的
所以结果i是 55 - 5 = 50;
二、串的模式匹配
*2.1简单的模式匹配(BF算法)
从一个串T的第一个开始和串S的第一个开始匹配,逐个比较后继字符,失败从串S的下一给字符重新和串T匹配;以此类推,直至T中的个字符和主串S中的一个连续的字符序列相等,则匹配成功
*2.2 KMP
前缀:除最后一个字符以为,字符所有头部子串
后缀:指除第一个字符外,字符串的所有尾部子串
最长前后缀:部分匹配值则为字符串的前缀和后缀的最长相等字符
举例:’a‘的前后缀都为空集,最长向等前后缀长度为0
’ab‘的前缀为{a},后缀为{b},,最长向等前后缀长度为0
'aba'的前缀为{a,ab},后缀为{a,ba},,最长向等前后缀长度为1
'abab''的前缀为{a,ab,aba} 后缀为{b,ab,bab}={ab},最长向等前后缀长度为2
'ababa'的前缀为{a,ab,aba,abab} 后缀为{a,ba,aba,baba}={a,aba},公共元素2个,最长向等前后缀长度为3
a b a b a通过上述每个位置字符最长前后缀求的一个对应值为
a | b | a | b | a |
0 | 1 | 1 | 2 | 3 |
第一趟过程中c 与 a 不匹配,前面两个字符ab是匹配的,最后一个匹配字符值b对应值为0
按公式 移动位数=已匹配的字符数-对应的部分匹配值 =2-0=2 移动2个位置
*next数组
*next数组优化->nextval数组
假如有next数组如下:
a | b | c | a | c | a |
0 | 1 | 1 | 2 | 1 | 3 |