字符串匹配之有限自动机
先来看什么是有限自动机?
首先,有限状态机是一个判定的机器,所谓判定的机器就是你给它输入一个模式,会的到一个 YES或者NO Y E S 或 者 N O 的结果,比如要判断 1+1 1 + 1 的结果:
有限状态机就是构建出一个满足某个特定模式的判断系统
例如,对于 0101111001 0101111001 串二进制数构建一个判断 1 1 的个数是否为偶数个的有限自动机
上图中,红色为自动机的出口,即
的位置
如果一个串输入的最后停留在 YES Y E S 的位置,说明串中1的个数为偶数,如 0101 0101 。
反之如果串输入后停在了其他的位置或者卡死在某一个位置,说明这个串是 NO N O 的,如 0100 0100 。
字符串匹配自动机
对于字符串的处理,我们可以利用有限自动机来判断,对模式串 P P 构建一个有限自动机,用其来判断文本串
,如果文本串 T T 可以到达
的位置,说明文本串 T T 中包含了模式串
例如,对 P="ababaca" P =" a b a b a c a " 构建有限自动机
上面的有限自动机中, 0 0 为开始,输入模式串P后分别经过了{
}到达了 7 7 的位置,为