字符串介绍
字符串比较大小跟传统的数字比较有点差别,很容易我们可以知道2比1大,可是字符串怎么比较呢?其实就是比较字符串里每个字符的ASCII码大小,但是单纯比较字符串大小没有太大意义。
字符串的存储结构与线性表相同,也分顺序存储结构和链式存储结构。字符串的顺序存储结构是一组连续的存储单元来存储串中的字符序列的。按照预定义的大小,为每个定义的字符串变量分配一个固定长度的存储区,一般用定长数组来定义。
与线性表相似,既然是固定长度的存储区,那末会考虑用链式存储结构。
不同的是字符串我们一般都是连在一起表述的,“断章取义”的情况并不多,所以习惯上我们通常还是会直接定义一个足够长度的存储区来存储的,也就是顺序结构。
BF算法
BF算法属于朴素的模式匹配算法,它的核心思想是:
有两个字符串S和T,长度为N和M。首先S[1]和T[1]比较,若相等,则再比较S[2]和T[2],一直到T[M]为止;若S[1]和T[1]不等,则向右移动一个字符的位置,再依次进行比较。该算法最坏的情况下要进行M*(N-M+1)次比较,时间复杂度为O(M*N)。
KMP算法
KMP算法又叫克努特-莫里斯-普拉特算法,KMP算法的核心就是避免不必要的回溯,问题是由模式串决定,不是由目标串决定。KMP算法的关键是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。具体实现就是实现一个next()函数,函数本身包含了模式串的局部匹配信息。模式串其实就是子串,目标串就是待匹配的串。