Java实现算法导论中有限自动机字符串匹配算法

原创地址:https://blog.csdn.net/fjssharpsword/article/details/53465266

 

这里实现了基于有限自动机(Finite Automaton,FA)的模式匹配算法,算法的重点在于利用字符串的前后缀构造模式P的自动机,具体结合导论中的说明来理解,可参考http://www.geeksforgeeks.org/searching-for-patterns-set-5-finite-automata/理解,参考代码如下:

 

  1.  
    package cn.ansj;
  2.  
     
  3.  
    public class AtuomatonMatcher {
  4.  
    final public static int NO_OF_CHARS= 256; //假设字母表有256个字符
  5.  
     
  6.  
    //对于状态k和给定的字符x,返回下一个状态。M为pat的长度
  7.  
    public static int getNextState(char[] pat, int M, int k, int x){
  8.  
    // 因为:pat[0...k-1]x 和 pat 的前面都是是一样的,如果x == pat[k]可直接返回。
  9.  
    if (k < M && x == pat[k])
  10.  
    return k+ 1;
  11.  
     
  12.  
    int ns, i; // ns 是下一个状态
  13.  
    // ns 最终是最长的那个 prefix (同时也是pat[0..k-1]x)的后缀
  14.  
    //从可能得最长的前缀位置开始,找到后break,即为所求
  15.  
    for (ns = k; ns > 0; ns--) {
  16.  
    if(pat[ns- 1] == x){
  17.  
    for(i = 0; i < ns- 1; i++) {
  18.  
    if (pat[i] != pat[k-ns+ 1+i])
  19.  
    break;
  20.  
    }
  21.  
    if (i == ns- 1)
  22.  
    return ns;
  23.  
    }
  24.  
    }
  25.  
    return 0;
  26.  
    }
  27.  
     
  28.  
    /* 构建FA */
  29.  
    public static void computeTF(char[] pat, int M, int[][] TF){
  30.  
    int state, x;
  31.  
    for (state = 0; state <= M; ++state)
  32.  
    for (x = 0; x < NO_OF_CHARS; ++x)
  33.  
    TF[state][x] = AtuomatonMatcher.getNextState(pat, M, state, x);
  34.  
    }
  35.  
     
  36.  
    /* 查找模式串 */
  37.  
    public static void matcher(char[] pat, char[] txt){
  38.  
    int M = pat.length;
  39.  
    int N = txt.length;
  40.  
    //TF数组存储FA有限状态机
  41.  
    int[][] TF= new int[M+ 1][NO_OF_CHARS];
  42.  
    AtuomatonMatcher.computeTF(pat, M, TF); //计算模式pat的有限自动机
  43.  
    // Process txt over FA.
  44.  
    int i, state= 0;
  45.  
    for (i = 0; i < N; i++) {
  46.  
    state = TF[state][txt[i]];
  47.  
    if (state == M){
  48.  
    int index=i-M+ 1;
  49.  
    System.out.println( "pattern found at index:"+index);
  50.  
    }
  51.  
    }
  52.  
    }
  53.  
     
  54.  
    public static void main(String[] args){
  55.  
    String strTxt= "AABAACAADAABAAABAA";
  56.  
    String strPat= "AABA";
  57.  
    char[] txt = strTxt.toCharArray();
  58.  
    char[] pat = strPat.toCharArray();
  59.  
    AtuomatonMatcher.matcher(pat, txt);
  60.  
    }
  61.  
    }


执行结果:

 

  1.  
    pattern found at index: 0
  2.  
    pattern found at index: 9
  3.  
    pattern found at index: 13
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值