KMP模式匹配 Java实现

<span style="font-size:18px;">/**
 * KMP模式匹配  O(m+n)
 */
package DataStructureAndAlgorithm.KMP;
/**
 * KMP模式匹配关键是要找准回溯位,即要高效准确求得find(Fail函数)数组。
 * @author zhen
 *
 */
public class KMPAlgorithm {
    private int[] find;
    //target:主串,mode:子串;返回值表示在主串哪个位置匹配(从0开始),-1表示无法匹配。
    public int findKMP(String target,String mode){
        if(mode==null||target==null||mode.length()>target.length()){
            return -1;
        }
        failFind(mode);
        int j=0,i=0,m=target.length(),n=mode.length();
        char[] targetArray=target.toCharArray();
        char[] modeArray=mode.toCharArray();
        while(i<m&&j<n){
            //j==-1或相等时,i、j均后移一位
            if(j==-1||modeArray[j]==targetArray[i]){
                i++;
                j++;
            }else{
                j=find[j];//到达失配点,j回溯到find[j]
            }
        }
        return ((j==n)?i-n:-1);//返回匹配点位置
    }
    private int[] failFind(String mode){
        find=new int[mode.length()];
        int j=0,k=-1,n=mode.length();
        System.out.println(n);
        find[0]=-1;
        char[] modeArray=mode.toCharArray();
        while(j<n-1){
            //k==-1或mode[i]=mode[j],j、k个扩展一位
            if(k==-1||modeArray[j]==modeArray[k]){
                j++;k++;
                //改进的失败函数:eg:target[7]='a',mode[7]='b',target[7]!=mode[7],取j=find[7]=4;
                //即第二趟从mode[4]与target[7]继续比较,由于mode[4]=mode[7]='b';因此mode[7]!=target[7],
                //所以本次回溯无意义!同理类推。因此改进失败函数计算方法:在求得k值后,不是马上将k值存放到find[j]中,
                //而是判断比较mode[k]和mode[j]是否相等?若不等,将k存入find[j];
                //若相等,将find[k]存入find[j]
                if(modeArray[j]==modeArray[k]){
                    find[j]=find[k];
                }else{
                    find[j]=k;
                }
            }else{
                k=find[k];
            }
        }
        return find;
    }
}

</span>

简单模式匹配为:从主串S中下标i的字符与模式串P的第1个字符a0开始逐个比较,遇到不相等时,即到达失配点,该趟匹配失败,S回到原来的i加1位置,P回到第一个字符位置,继续下趟匹配,以此类推。(算法简单,效率O(m*n))

KMP模式匹配算法中,消除不必要的回溯,主串的i只进不退,关键在于子串的j回溯到什么位置?改进的失败函数较好的确定了j的回溯位。KMP效率:O(m+n)。

。。。。KMP模式匹配比较烧脑耶,要细细品味。。。。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值