字符串查找算法：暴力、KMP、DFA

最新推荐文章于 2024-09-01 17:02:34 发布

CodePanda@GPF

最新推荐文章于 2024-09-01 17:02:34 发布

阅读量1.1k

点赞数

分类专栏：数据结构与算法文章标签： java JVM 双亲委派

本文链接：https://blog.csdn.net/qq_43478694/article/details/123854612

版权

文章目录

1. 暴力查找

给出主串txt, 模式串pat, 查找pat在txt中出现的位置，不存在则返回-1

package algorithm;

public class SubstrSearchDemo {
   

	/*
	 * 在txt主串中查找子串pat第一次出现的位置
	 */
	public static int search(String pat,String txt) {
   
		int M=pat.length();
		int N=txt.length();
		//pat在txt的起始位置为[0,N-M) pat本身长度为M 
		//在位置N-M-1处往后找还不能匹配  后面也就不可能匹配了
		for(int i=0;i<N-M;i++)
		{
   
			int j;
			for(j=0;j<M;j++)//j扫描模式串pat 
			{
   
				if(pat.charAt(j)!=txt.charAt(i+j))//不等直接跳出
					break;
			}
			if(j==M)//j==M说明[0,M-1]都匹配了  匹配成功
				return i;
		}
		return -1;//未找到返回-1
	}
	public static void main(String[] args) {
   
		String txt="helloworld";
		String pat="llo";
		System.out.println(search(pat, txt));//2
	}
}

时间复杂度：O(MN)

暴力法的一种优化：查找失败时，i不需要回退到0，回退到i-j的位置即可， j是已经匹配成功的序列的长度
证明：反证法：假设区间[0,i-j-1]存在一个start,以该start为字符序列的开始位置，可以匹配成功，则不会到达当前j的位置，在j之前就已经匹配成功了，但是现在到达了j位置，所以说明以[0,i-j-1]内的任何位置为起点都不能匹配成功，证毕

package algorithm;

public class SubstrSearchDemo {
   

	/*
	 * 在txt主串中查找子串pat第一次出现的位置
	 */
	public static int search(String pat,String txt) {
   
		int M=pat.length();
		int N=txt.length();
		int i,j;
		//i指向txt中匹配过的字符序列的末端
		for(i=0,j=0;i<N&&j<M;i++)
		{
   
			if(pat.charAt(j)==txt.charAt