BF和KMP算法

字符串

字符串的定义
  • 定义:串( String)是由零个或多个字符组成的有限序列,又名叫字符串。
  • 一般记为s=“a1a2a3…an” (n>=0)
  • 串可以是空串,即没有字符,直接由””表示(注意里边没有空格),或者可以用希腊字母Φ来表示。
  • 子串与主串,例如“lie”是“believe”的子串,反之则倒过来。
字符串的比较

字符串比较大小跟传统的数字比较有点差别,比的是字符串里每个字符的ASCII码大小
因为‘F’==70,‘f’==102 ,所以“ fish,com”>“ Fish”。其实这样的比较大小没有多大意义,字符串的比较我们更重视是否相等。

字符串的存储结构
  • 字符串的存储结构与线性表相同,也分顺序存储结构和链式存储结构。
  • 字符串的顺序存储结构是用一组地址连续的存储单元来存储串中的字符序列的。
  • 按照预定义的大小,为每个定义的字待串变量分配一个固定长度的存储区,一般用定长数组来定义。

BF算法

BF(Brute force)算法,属于朴素的模式匹配算法。

  • 定义两个串,S是主串,T是子串,这种子串的定位操作称作穿的模式匹配。
  • 它的核心思想是 (回溯思想): 有两个字符串S和T,长度为N和M。首先S[1]和T[1]比较,若相等,则再比较S[2]和T[2],一直到T[M]为止;若S[1]和T[1]不等,则T向右移动一个字符的位置,再依次进行比较。
  • 该算法最坏情况下要进行M*(N-M+1)次比较,时间复杂度为0(M*N)。

KMP算法

KMP算法的核心就是避免不必要的回溯,那么什么是不必要的呢?问题由模式串(T)决定,不是由目标(S)决定!

KMP算法之next数组代码原理分析

T9ababaaaba
下标0123456789
nextx011234223

i(后缀)=1 2 _ 3 4 5 6 7 _ 8 9
j(前缀)=0 1 0 1 2 3 4 2 1 2 3

  • NEXT数组:当模式匹配串T失配的肘候,NEXT数组对应的元素指导应该用T串的哪个元素进行下一轮的匹配。
void get_next( String T, int *next)
{
    j=0,i=1;
    next[1]=0;
    while(i<T[0])
    {
        if(0==j||T[i]==T[j])
        {
            i++;
            j++;
            next[i]=j;
        }
        else
        {
        //因为前级是固定的,后级是相对的
        //回溯
        j=next[j];}
    }
}
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值