字符串匹配算法 golang实现

字符串匹配算法 golang实现



KMP算法


算法思想


KMP算法是一种改进的字符串匹配算法,其关键是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的 。

求得模式的特征向量之后,基于特征分析的快速模式匹配算法(KMP模式匹配算法)与朴素匹配算法类似,只是在每次匹配过程中发生某次失配时,不再单纯地把模式后移一位,而是根据当前字符的特征数来决定模式右移的位数 。


视频讲解:

https://www.bilibili.com/video/BV1Px411z7Yo?spm_id_from=333.999.0.0


代码

package main

import "fmt"

// 生成前缀表
func prefixTable(pattern string, prefix []int, n int)  {
	// 前缀表的第一个为0
	prefix[0] = 0
	// 当前已经匹配到的长度
	len := 0
	// 从第一个开始匹配
	i := 1
	for i < n {
		// 如果当前遍历到的字符 等于 已经匹配到字符串的下一位,len++
		if pattern[i] == pattern[len] {
			len++
			// 填写最大公共前后缀
			prefix[i] = len
			// 继续往后遍历
			i++
		} else {
			//当前遍历到的字符 不等于 已经匹配到字符串的下一位,且len不等于0,往斜后方对齐
			if len > 0 {
				len = prefix[len - 1]
				//否则当前最大公共前后缀才等于0,即len
			} else {
				prefix[i] = len
				i++
			}
		}
	}
}

// 将前缀表向后移动一位
func movePrefixTable(prefix []int, n int) {
	for i := n - 1; i > 0; i-- {
		prefix[i] = prefix[i - 1]
	}
	// 第一位置为-1
	prefix[0] = -1
}

// kmp搜索
func kmpSearch(text string, pattern string) int {
	m := len(text)
	n := len(pattern)
	prefix := make([]int, n)

	prefixTable(pattern, prefix, n)
	movePrefixTable(prefix, n)

	// i遍历模式串,j遍历匹配串
	i := 0
	j := 0

	// 开始匹配
	for i < m {
		//如果j刚好等于匹配串最后一个字符的下标 而且 最后一位字符也相同
		if j == n - 1 && text[i] == pattern[j] {
			return i - j
		}
		//如果两个对应的字符相等,就往后遍历
		if text[i] == pattern[j] {
			i++
			j++
		} else {
			//如果不相等,那么就将j移动到前缀表对应的那个下标
			j = prefix[j]
			//前缀表的-1表示向后移动一位
			if j == -1 {
				i++
				j++
			}
		}
	}
	return -1
}



func main() {
	pattern := "ABABCABAA"
	text := "ABABABCABAABABABAB"

	fmt.Println(kmpSearch(text, pattern))
}


sunday算法


算法思想


Sunday算法由Daniel M.Sunday在1990年提出,它的思想跟BM算法很相似。

只不过Sunday算法是从前往后匹配,在匹配失败时关注的是主串中参加匹配的最末位字符的下一位字符。

  • 如果该字符没有在模式串中出现则直接跳过,即移动位数 = 模式串长度 + 1;
  • 否则,其移动位数 = 模式串长度 - 该字符最右出现的位置(以0开始) = 模式串中该字符最右出现的位置到尾部的距离 + 1。

视频讲解:

https://www.bilibili.com/video/BV1zf4y1N7H9?from=search&seid=16752958135964048105&spm_id_from=333.337.0.0


个人觉得sunday算法的思想要比kmp算法简单很多,效率也比kmp高。


代码


package main

import (
	"fmt"
	"unicode/utf8"
)

func sundaySearch(s string, t string) int {
	index := 0   //index用来遍历模式串的下标
	len := len(t)   //len等于匹配串长度
	var flag bool   //用来标记有没有找到
	for index < utf8.RuneCountInString(s)  {
		//字符一样
		flag = true
		for i := 0; i < len; i++ {
			//出现了不一样的字符
			if t[i] != s[index + i] {
				flag = false
				break
			}
		}
		//都一样 结束 返回
		if flag {
			return index
		} else {
			//有这个字符
			flag = true
			for i := 0; i < len; i++ {
				//在t中找到了末尾后一个字,对齐
				if t[i] == s[index + len] {
					index += len - i
					flag = false
					break
				}
			}
			//没有找到 跳过
			if flag {
				index += len + 1
			}
		}
	}
	return -1
}

func main() {
	s := "ABABABCBA"
	t := "CBA"
	fmt.Println(sundaySearch(s, t))
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值