定义:零个或多个任意字符组成的有限序列。
s="a1a2~an"
s为串名,双引号中为串值,串长为n,空串用∅表示
子串:串中任意个连续字符组成的子序列(含空串)
真子串:不包含自身的所有子串
主串:包含子串的串相应地称为主串
字符位置:字符在序列中的序号
子串位置:子串第一个字符在主串中的位置(主串第一个字符位置为1)
空格串:由一个或多个空格组成的串,与空串不同
串相等:当且仅当两个串的长度相等并且各个对应位置上的字符都相等时,这两个串才是相等的
所有空串是相等的
串的存储结构分为顺序存储结构和链式存储结构:(一般用顺序存储结构)
顺序串定义:
串的模式匹配算法:
目的:确定主串中所含子串第一次出现的位置
算法种类:1.BF算法,暴力破解法,采用穷举法的思路,从主串的每一个字符开始一次与子串( 模式串)的字符进行匹配,时间效率较差,时间复杂度为O(n*m),m,n分别为主串子 串长度
2.KMP算法,速度快(我不太能理解)
BF算法思路:
Index(S,T,pos)
将主串第pos个字符与模式串串第一个字符比较
若相等,则继续逐个比较后续字符
若不等,则从主串的下一字符起,重新与模式串的第一个字符比较
直到主串的一个连续子串字符序列与模式串相等,返回S中与T匹配的子序列的第一个字符的序号,否则返回0
代码如下:
KMP算法思路:
利用已知部分匹配结果加快串的滑动速度,主串S指针i不必回溯,时间复杂度为O(n+m)
链串:
优点:操作方便
缺点:存储密度(串值所占的存储/实际分配的存储)低
因此可以将多个字符放在一个节点中,克服弱点
定义: