字符串匹配算法 golang实现
KMP算法
算法思想
KMP算法是一种改进的字符串匹配算法,其关键是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的 。
求得模式的特征向量之后,基于特征分析的快速模式匹配算法(KMP模式匹配算法)与朴素匹配算法类似,只是在每次匹配过程中发生某次失配时,不再单纯地把模式后移一位,而是根据当前字符的特征数来决定模式右移的位数 。
视频讲解:
https://www.bilibili.com/video/BV1Px411z7Yo?spm_id_from=333.999.0.0
代码
package main
import "fmt"
// 生成前缀表
func prefixTable(pattern string, prefix []int, n int) {
// 前缀表的第一个为0
prefix[0] = 0
// 当前已经匹配到的长度
len := 0
// 从第一个开始匹配
i := 1
for i < n {
// 如果当前遍历到的字符 等于 已经匹配到字符串的下一位,len++
if pattern[i] == pattern[len] {
len++
// 填写最大公共前后缀
prefix[i] = len
// 继续往后遍历
i++
} else {
//当前遍历到的字符 不等于 已经匹配到字符串的下一位,且len不等于0,往斜后方对齐
if len > 0 {
len = prefix[len - 1]
//否则当前最大公共前后缀才等于0,即len
} else {
prefix[i] = len
i++
}
}
}
}
// 将前缀表向后移动一位
func movePrefixTable(prefix []int, n int) {
for i := n - 1; i > 0; i-- {
prefix[i] = prefix[i - 1]
}
// 第一位置为-1
prefix[0] = -1
}
// kmp搜索
func kmpSearch(text string, pattern string) int {
m := len(text)
n := len(pattern)
prefix := make([]int, n)
prefixTable(pattern, prefix, n)
movePrefixTable(prefix, n)
// i遍历模式串,j遍历匹配串
i := 0
j := 0
// 开始匹配
for i < m {
//如果j刚好等于匹配串最后一个字符的下标 而且 最后一位字符也相同
if j == n - 1 && text[i] == pattern[j] {
return i - j
}
//如果两个对应的字符相等,就往后遍历
if text[i] == pattern[j] {
i++
j++
} else {
//如果不相等,那么就将j移动到前缀表对应的那个下标
j = prefix[j]
//前缀表的-1表示向后移动一位
if j == -1 {
i++
j++
}
}
}
return -1
}
func main() {
pattern := "ABABCABAA"
text := "ABABABCABAABABABAB"
fmt.Println(kmpSearch(text, pattern))
}
sunday算法
算法思想
Sunday算法由Daniel M.Sunday在1990年提出,它的思想跟BM算法很相似。
只不过Sunday算法是从前往后匹配,在匹配失败时关注的是主串中参加匹配的最末位字符的下一位字符。
- 如果该字符没有在模式串中出现则直接跳过,即移动位数 = 模式串长度 + 1;
- 否则,其移动位数 = 模式串长度 - 该字符最右出现的位置(以0开始) = 模式串中该字符最右出现的位置到尾部的距离 + 1。
视频讲解:
个人觉得sunday算法的思想要比kmp算法简单很多,效率也比kmp高。
代码
package main
import (
"fmt"
"unicode/utf8"
)
func sundaySearch(s string, t string) int {
index := 0 //index用来遍历模式串的下标
len := len(t) //len等于匹配串长度
var flag bool //用来标记有没有找到
for index < utf8.RuneCountInString(s) {
//字符一样
flag = true
for i := 0; i < len; i++ {
//出现了不一样的字符
if t[i] != s[index + i] {
flag = false
break
}
}
//都一样 结束 返回
if flag {
return index
} else {
//有这个字符
flag = true
for i := 0; i < len; i++ {
//在t中找到了末尾后一个字,对齐
if t[i] == s[index + len] {
index += len - i
flag = false
break
}
}
//没有找到 跳过
if flag {
index += len + 1
}
}
}
return -1
}
func main() {
s := "ABABABCBA"
t := "CBA"
fmt.Println(sundaySearch(s, t))
}