字符串匹配

最近看了一下字符串匹配的知识,在这里总结一下。在算法导论中作者给出了四种字符串匹配算法,这里给出两种最常用的字符串匹配算法:朴素字符串匹配算法和KMP算法

  1. 朴素字符串匹配算法
    假设文本是一个长度为n的数组T[1…n],而模式是一个长度为m的数组P[1…m]。朴素的字符串匹配算法,不需要预处理操作,其复杂度是O((n-m+1)*m)。这里直接给出该方法的算法和Java实现。
naive-string-matcher(T,P)
1 n = T.length
2 m = P.length
3 for s = 0 to n - m
4     if P[1...m] == T[s+1...s+m]
5         print "Pattern occurs with shift" s

3~5行考察每个可能得偏移量,第4行监测代码包括了一个循环结构,该循环可以检测对应位置上的字符,直到所有的位置能够成功匹配或者有一个位置不能匹配为止。该算法最终返回的是匹配位置的下标或者-1。

    public int naiveStringMatcher(char[] s, char[] p, int pos){
    /*
    * s是文本,p是模式,    求p在主串s中从第pos个位置开始的匹配位置
    * 如果匹配成功返回模式串在主串中的位置,否则返回-1
    */
        for (int i = 0; i < s.length; i++) {
            if(s[i] == p[0]){
                int j = 1;
                for(; j < p.length; j++){
                    if(s[i + j] != p[j])break;
                }
                if(j >= p.length) return i;
            }
        }
        return  -1;
    }
  1. KMP算法
    KMP算法又被称为改进的模式匹配算法,其改进之处在于:每当匹配过程中出现相比较的字符不相等时,不需要回溯主串的字符位置指针,而是根据自己已经得到的部分匹配的结果,将模式串向右滑动尽可能远的距离,然后,进行下一轮比较。
    在KMP算法中,依靠模式串的next函数值实现指针的滑动。next函数定义如下:

    next函数

    //next function
    public void getNext(char[] p, int[] next){
        int i = 0, j = -1, len = p.length;
        next[0] = -1;
        while(i < len){
            if(j == -1 || p[i] == p[j]){
                ++i;
                ++j;
                if(i < len)
                    next[i] = j;
            }else j = next[j];
        }
    }
    //KMP algorithm
    public int KMP(char[] s, char[] p, int pos, int next[]){
        /*
         * 使用模式串p的next函数,求p在主串s中从第pos个位置开始的匹配位置
         * 如果匹配成功返回模式串在主串中的位置,否则返回-1
         */
        int i = pos - 1, j = -1, slen = s.length, plen = p.length;
        while(i < slen && j < plen){
            if(j == -1 || s[i] == p[j]){
                i++;
                j++;
            }else j = next[j];
        }
        if(j >= plen) return i - plen;
        else return -1;
    }

具体的next的演算请参考:http://kb.cnblogs.com/page/176818/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在Python中,有多种方法可以进行字符串匹配,具体的选择取决于你的需求和场景。以下是几种常见的字符串匹配方法: 1. 使用`==`运算符进行匹配:你可以使用`==`运算符来判断两个字符串是否相等。例如: ```python str1 = "hello" str2 = "world" if str1 == str2: print("字符串匹配成功") else: print("字符串匹配失败") ``` 2. 使用`in`关键字进行匹配:你可以使用`in`关键字来判断一个字符串是否包含另一个字符串。例如: ```python str1 = "hello world" str2 = "world" if str2 in str1: print("字符串匹配成功") else: print("字符串匹配失败") ``` 3. 使用`find()`方法进行匹配:`find()`方法可以用来查找一个子字符串在原字符串中的位置。如果找到了子字符串,它会返回子字符串的起始位置;如果没有找到,它会返回-1。例如: ```python str1 = "hello world" str2 = "world" index = str1.find(str2) if index != -1: print("字符串匹配成功,起始位置为", index) else: print("字符串匹配失败") ``` 4. 使用正则表达式进行匹配:正则表达式是一种强大的字符串匹配工具,可以用来匹配更加复杂的字符串模式。Python提供了`re`模块来支持正则表达式操作。例如,你可以使用`re.search()`函数来查找一个字符串中是否存在匹配某个模式的子字符串: ```python import re str1 = "hello world" pattern = r"world" match = re.search(pattern, str1) if match: print("字符串匹配成功") else: print("字符串匹配失败") ``` 这些是一些常见的字符串匹配方法,你可以根据具体的需求选择合适的方法来进行字符串匹配

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值