前言
本系列文章为leetCode刷题笔记,仅供参考。
一、题目描述
若字符串 a 包含字符串 b,返回 b 在 a 中的起始下标,否则返回 -1。a,b 均不为空。
二、思路
1.朴素匹配
对字符串a遍历,依次判断是否存在字串b,时间复杂度为O(n*m),空间复杂度为O(1)。()
代码如下:
class Solution {
public int findSubString(String a,String b)//找字串b在a中的起始下标
{
for(int i=0;i<=a.length()-b.length();i++)//结束条件并非为a.length()
{
int j;
for(j=0;j<b.length();j++)
{
if(a.charAt(i+j)!=b.charAt(j))
break;
}
if(j==b.length())
return i;
}
return -1;
}
}
1.1Java直接实现
采用String的IndexOf函数来实现:
class Solution {
public int findSubString(String a,String b)//找字串b在a中的起始下标
{
return a.indexOf(b);
}
}
2.kmp模式匹配
kmp 模式匹配的最大特点是字符串 a 的下标不会回溯。在字符串 b 和 a 的匹配过程中,如果发现 a[i] != b[j] 时,不会像朴素匹配那样,后退 i,而是根据当前已有的匹配结果(字符串 “a[i-j]…a[i-1]” 和 字符串 “b[0]…b[j-1]” 是一样的),采用 b[j’] 继续和 a[i] 继续进行匹配…
所以最主要的目标是如何来求 j’ ? 即求字符串 b 所对应的 next 数组,此数组包含了若匹配失败时,某个下标应跳转到的另一个新下标值。
1,如果 b[0] 和 a 中某个元素匹配失败,此时应该需要让 i 加一,让 b[0] 和 a 中的下一个元素进行匹配… 这种情况下:令 next[0]=-1。
2,定义:仅有 next[0] 的值能为-1,其余有些应为 -1 的值全置为 0,便于后面算法的实现。(因此这个算法并不完善:当 b 为 “ab” 时:next 数组为 [-1,0],这里没错;当 b 为 ”aa" 时:next 数组应为 [-1,-1],但实际的 next 数组为 [-1,0],多了一个无用的比较。)因此在这种情况下 next[1] 总是为 0。
3,当 b[j] != a[i] 时,即想求 next[j] 的值时,需要先判断(且令 k=next[j-1]):如果 b[k] == b[j-1],应该让 b[k+1] 和 a[i] 继续比较,故令 next[j] = k+1。 如果 b[k] != b[j-1],继续迭代判断 b[next[k]] 是否和 b[j-1] 相等…
求 next 数组的算法可参考如下示例:
public static int[] getNext(String b){
int len=b.length();
int[] next=new int[len];
next[0]=-1;
int j,tmp;
for(j=1;j<len;j++){
tmp=next[j-1];
if(tmp==-1||b.charAt(j-1)==b.charAt(tmp))
next[j]=tmp+1;
else{
while(tmp!=-1&&b.charAt(j-1)!=b.charAt(tmp))
tmp=next[tmp];
next[j]=tmp+1;
}
}
return next;
}
kmp 模式匹配算法可参考如下代码:
public static int kmp(String a, String b){//a,b均不为空
int lenA=a.length(),lenB=b.length();
int[] next=getNext(b);
int i,j;
for(i=0;i<=lenA-lenB;i++){
for(j=0;j<lenB;){
if(a.charAt(i)==b.charAt(j)){
i++;
j++;
}
else{
j=next[j];
if(j==-1)
break;
}
}
if(j==lenB)
return i-lenB;
}
return -1;
}
总结