算法很美:PaBinKarp字符串匹配之滚动hash

算法思想

  • 假设子串的长度为M,目标字符串的长度为N
  • 计算子串的hash值
  • 计算目标字符串中每个长度为M的子串的hash值(共需要计算N-M+1次)
  • 比较hash值
  • 如果hash值不同,字符串必然不匹配,如果hash值相同,还需要使用朴素算法再次判断

算法关键

  • 在计算源串的hash值时若每次都调用hash()方法,则使时间复杂度达到O(mn)级别,与暴力扫描几乎一样,所以在计算源串hash时,可采用对上一组的hash值*seed-多余的部分。

代码

public static void main(String[] args) {
        //源串
        String s="ABABAB";
        //模式串
        String p="ABA";
       paBinKarp(s,p);
    }

    //返回匹配模式串的坐标 s:源串 P:模式串
    private static void paBinKarp(String s, String p) {
        long hash_p = hash(p, 500);
        int pLength=p.length();
        long[] hash_s = hash(s, pLength, 500);
        for (int i = 0; i < hash_s.length; i++) {
            //System.out.println(hash_s[i]);
            if(hash_s[i]==hash_p){
                System.out.println("match"+i);
            }
        }
    }

    public static long[] hash(String s,int patternLength,int seed){

        long[] hash=new long[s.length()-patternLength+1];
        hash[0]=hash(s.substring(0,patternLength),500);

        //i为源串匹配过程中的的末尾
        for (int i = patternLength; i < s.length(); i++) {
            char newChar=s.charAt(i);
            char oldChar=s.charAt(i-patternLength);
            hash[i-patternLength+1]= (long) ((hash[i-patternLength]*seed+newChar-oldChar*Math.pow(seed,patternLength))%Long.MAX_VALUE);
        }
        return hash;
    }

    public static long hash(String s,int seed){
        long hash=0;
        for (int i = 0; i < s.length(); i++) {
            hash=hash*seed+s.charAt(i);
        }
        return hash;
    }
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值