java 字符串模式匹配_算法之字符串模式匹配

本文详细介绍了两种常用的字符串模式匹配算法——朴素模式匹配和KMP算法。朴素模式匹配是最基础的算法,每次匹配失败时主串回溯。KMP算法则通过next数组优化匹配过程,避免无效的回溯,提高效率。文章提供了Java代码实现,并通过示例解释了算法工作原理。
摘要由CSDN通过智能技术生成

导读

字符串模式匹配是常见的算法之一,在实际生活中有较高的使用频率。本文详细介绍两种最常见的字符串模式匹配算法:朴素模式匹配

KMP模式匹配

字符串模式匹配,也称子串的定位操作,通俗的说就是在一个主串中判断是否存在给定的子串(又称模式串),若存在,则返回匹配成功的索引。如:

主串:zhuanlanzhihu

子串:zhihu

主串中包含子串"zhihu",说明匹配成功,且返回的索引为:8

注:本文所有出现的字符串的下标都是从0开始标记,并用Java语言实现算法。

朴素模式匹配

串的朴素模式匹配算法也称为BF(Brute-Force)算法,其基本思想是:从主串的第一个字符起与子串的第一个字符进行比较,若相等,则继续逐对字符进行后续的比较;若不相等,则从主串第二个字符起与子串的第一个字符重新比较,以此类推,直到子串中每个字符依次和主串中的一个连续的字符序列相等为止,此时称为匹配成功。如果不能在主串中找到与子串相同的字符序列,则匹配失败。BF算法是最原始、最暴力的求解过程,但也是其他匹配算法的基础。下面通过具体Demo演示该算法的基本思想。

主串:zhihzhiuzhihu

子串:zhihiu

注:绿颜色代表匹配成功的字符,红颜色代表匹配失败的字符

首先,将主串的第一个字符与子串的第一个字符进行比较,即主串中的第一个字符'z'与子串的第一个字符'z'进行比较,二者相等,依次继续比较,主串第一个字符后面的'h'、 'i' 、'h'分别与子串第一个字符后面的'h' 、'i'、 'h'进行比较,都分别对应相等,继续比较主串的'z'与子串的'u',因为'z'与'u'不相等,则趟匹配失败。

这时,将主串的指针回溯到第一次比较开始字符的下一个字符即'h',子串从第一个字符'z'与'h'比较,'z'与'h'不相等,进行下一趟比较。

同理依次比较,主串的'i'与'z'不相等,本趟匹配失败。继续从主串的下一个字符'h'与子串的第一个字符'z'进行比较,'h'与'z'不相等,本趟匹配失败。

同理,继续从主串的下一个字符'z'与子串的'z'比较,相等,继续逐次对应比较,'h'与'h'相等,'i'与'i'相等,但后面的对应的'u'与'h'不相等,匹配再次失败。

主串需要回溯到'z'的下一个字符'h'处,子串从头来继续匹配,即'h'与'z'不相等;主串的下一个字符继续与子串第一个字符比较,即'i'与'z'比较不相等;主串的下一个字符继续与子串第一个字符比较,即'u'与'z'不相等。

最后,主串的下一个字符'z'与子串的第一个字符'z'比较相等,继续逐次比较,这时发现对应相同位置的字符都相等,至此,在主串中成功匹配子串,并且位置为:8

根据算法的基本思想,编写完整的BF代码,为了方便起见,测试使用main()方法。

import java.util.Scanner;

public class BF {

public static v

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 好的,我可以回答这个问题。手写字符串模式匹配算法Java 中可以使用暴力匹配算法、KMP 算法、Boyer-Moore 算法等实现。其中,KMP 算法和 Boyer-Moore 算法都是比较高效的字符串匹配算法,可以在大规模文本中快速查找指定字符串。 ### 回答2: 手写字符串模式匹配算法主要有两种,分别是暴力匹配算法和KMP算法。 暴力匹配算法是一种简单直观的算法,它的思路是从待匹配字符串的第一个字符开始,逐个字符与模式串进行匹配。如果匹配失败,则将待匹配字符串的指针后移一位,再重新开始匹配。这个过程一直循环到待匹配字符串的指针达到末尾或者匹配成功为止。暴力匹配算法的时间复杂度为O(n*m),其中n为待匹配字符串长度,m为模式串长度。 下面是一个使用暴力匹配算法Java代码示例: ``` public class StringPatternMatching { public static int bruteForceMatcher(String text, String pattern) { int n = text.length(); int m = pattern.length(); for (int i = 0; i <= n - m; i++) { int j; for (j = 0; j < m; j++) { if (text.charAt(i + j) != pattern.charAt(j)) break; } if (j == m) return i; } return -1; } public static void main(String[] args) { String text = "ABCDABCDABDE"; String pattern = "ABC"; int index = bruteForceMatcher(text, pattern); if (index >= 0) System.out.println("匹配成功,匹配位置为:" + index); else System.out.println("匹配失败"); } } ``` 另一种常用的字符串模式匹配算法是KMP算法,它通过预处理模式串构建一个跳转表,使得在匹配过程中遇到不匹配的字符时,可以根据跳转表直接跳过一部分字符,从而提高效率。KMP算法的时间复杂度为O(n+m),其中n为待匹配字符串长度,m为模式串长度。 下面是一个使用KMP算法Java代码示例: ``` public class StringPatternMatching { public static int[] computeTable(String pattern) { int m = pattern.length(); int[] table = new int[m]; int i = 1, j = 0; while (i < m) { if (pattern.charAt(i) == pattern.charAt(j)) { table[i] = j + 1; i++; j++; } else { if (j != 0) { j = table[j - 1]; } else { table[i] = 0; i++; } } } return table; } public static int kmpMatcher(String text, String pattern) { int n = text.length(); int m = pattern.length(); int[] table = computeTable(pattern); int i = 0, j = 0; while (i < n) { if (text.charAt(i) == pattern.charAt(j)) { if (j == m - 1) return i - j; i++; j++; } else { if (j != 0) j = table[j - 1]; else i++; } } return -1; } public static void main(String[] args) { String text = "ABCDABCDABDE"; String pattern = "ABC"; int index = kmpMatcher(text, pattern); if (index >= 0) System.out.println("匹配成功,匹配位置为:" + index); else System.out.println("匹配失败"); } } ``` 以上是手写字符串模式匹配算法Java代码示例,分别使用了暴力匹配算法和KMP算法进行字符串模式匹配。 ### 回答3: 手写字符串模式匹配算法是指在一个字符串中查找指定的字符串模式,并返回模式在原字符串中的位置。 常见的手写字符串模式匹配算法有暴力匹配算法和KMP算法。下面我介绍一下如何用Java实现这两种算法。 1. 暴力匹配算法: 暴力匹配算法也叫朴素匹配算法,其原理是从原字符串第一个字符开始,逐个与模式字符串进行比较。若字符相同,则继续比较下一个字符;若不同,则将从原字符串的下一个字符重新开始与模式字符串进行比较。重复这个过程,直到找到第一个匹配或者遍历完整个原字符串。 代码实现如下: ```java public int indexOf(String s, String pattern) { int n = s.length(); int m = pattern.length(); for (int i = 0; i <= n - m; i++) { int j; for (j = 0; j < m; j++) { if (s.charAt(i + j) != pattern.charAt(j)) { break; } } if (j == m) { return i; } } return -1; } ``` 其中,s为原字符串,pattern为要匹配的模式字符串。 2. KMP算法: KMP算法通过预处理模式字符串,生成一个部分匹配表,用于在匹配过程中决定匹配失败后回溯的位置。算法的核心思想是利用匹配失败时已经部分匹配的信息,尽量减少不必要的比较。 代码实现如下: ```java public int indexOf(String s, String pattern) { int n = s.length(); int m = pattern.length(); int[] next = getNext(pattern); int i = 0; int j = 0; while (i < n && j < m) { if (j == -1 || s.charAt(i) == pattern.charAt(j)) { i++; j++; } else { j = next[j]; } } if (j == m) { return i - j; } else { return -1; } } private int[] getNext(String pattern) { int m = pattern.length(); int[] next = new int[m]; next[0] = -1; int i = 0; int j = -1; while (i < m - 1) { if (j == -1 || pattern.charAt(i) == pattern.charAt(j)) { i++; j++; next[i] = j; } else { j = next[j]; } } return next; } ``` 其中,s为原字符串,pattern为要匹配的模式字符串。getNext()函数用于生成部分匹配表。 通过以上两种算法,我们可以实现手写字符串模式匹配算法。两种算法各有优劣,在不同的场景下选择适合的算法可以提高算法的效率。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值