BF算法和KMP算法

字符串匹配算法:BF算法和KMP算法
1、bf算法:即朴素算法:他的实现方式是这样 的,假定我们给出字符串 ”ababcabcdabcde”作为主串,然后给出子串:”abcd”,现在我们需要查找子串 是否在主串中出现,出现返回主串中的第一个匹配的下标,失败返回-1。
在这里插入图片描述
时间复杂度:O(mn) m代表主串长度,n代表子串长度。
算法实现:
int BF(char *str,char *sub,int pos)
{
int i = pos;
int j = 0;
int lenstr = strlen(str);
int lensub = strlen(sub);
while(i < lenstr && j < lensub)
{
if(str[i] == sub[j])
{
i++;
j++;
}
else
{
j = 0;
i = i-j+1;
}
}
if(j >= lensub)
{
return i-j;
}
return -1;
}
2、KMP算法:相对于 BF 算法来说 KMP 算法更为高效,时间复杂度是O(m+n),我们举例来看:KMP 和 BF 唯一不一样的地方在,我主串的 i 并不会回退,并且 j 也不会移动到 0 号位置。还是老样子,举例来看:
在这里插入图片描述
在这里插入图片描述
而这种情况下, 这时候,对应的 next 数组:-1,0,0,0,1,2 next[2] 对应的就是 c.
假定主串 S 子串 P: P0…PK-1 = Px…Pj-1
则有:P0…PK-1 = Pj-k…Pj-1
接下来又有一个问题:每一次不成功,肯定会有对应的一个 K 值。那么如何保存这些值?怎么求这些值?那这就是 KMP 的精髓。在这里就会出现新的东西,那就是 next 数组;也就是用 next[j] = k;来表示,不同的 j 来对应一个 K 值, 这个 K 就是你将来要移动的 j 要移动的位置。
而 K 的值是这样求的:
1、规则:找到匹配成功部分的两个相等的真子串(不包含本身),一个以下标 0 开始,另一个以 j-1 下标结尾。
2、不管什么数据 next[0] = -1;next[1] = 0;在这里,我们以下标来开始,而说到的第几个第几个是从 1 开始; -1 的理由:当主串为–”defrdes” 子串为:”abc” 一开始就匹配失败。 0 的理由:当子串在 1 号下标匹配,此时为 0;

  1. 得到 next 数组:如果我们能够通过 next[i]的值,通过一系列转换得到 next[i+1]得值,那么我们就能够实现这部分。 那该怎么做呢?首先假设:next[i] = k 成立,呢么,就有这个式子成立:P0…Pk-1 = Px…Pi-1;得到:P0…Pk-1 = Pi-k…Pi-1; 到这一步:我们再假设如果 Pk = Pi;我们可以得到 P0…Pk = Pi-k…Pi;那这个就是 next[i+1] = k+1;那么:Pk != Pi 呢?首先 在不相等的时候,看这个例子:abcababcabc
    在这里插入图片描述
    next 数组的优化,即如何得到 nextval 数组: 有如下串:aaaaaaaab,他的 next 数组是-1,0,1,2,3,4,5,6,7.而修正后的数组 nextval 是: -1,-1,-1,-1,-1,-1,-1,-1,7。为什么出现修正后的数组,假设在 5 号处失败了,那退一步还是 a,还是相等, 接着退还是 a。
    2、代码实现:
    void GetNext(int *next,char *sub)
    {
    next[0] = -1;
    next[1] = 0;
    int j = 2;
    int k = 0;
    int len = strlen(sub);
    while(j < len)
    {
    if(k == -1 || sub[k] == sub[j-1])
    {
    next[j] = k+1;
    j++;
    k = k+1;
    }
    else
    {
    k = next[k];
    }
    }
    }
    int KMP(char *str,char *sub,int pos)
    {
    int i = pos;
    int j = 0;
    int lenstr = strlen(str);
    int lensub = strlen(sub);
    int *next = (int *)malloc(lensub * sizeof(int));
    assert(next != NULL);
    GetNext(next,sub);
    while(i < lenstr && j < lensub)
    {
    if(j == -1 || str[i] == sub[j])
    {
    i++;
    j++;
    }
    else
    {
    j = next[j];
    }
    }
    if(j >= lensub)
    {
    return i-j;
    }
    return -1;
    }

int main()
{
char *str = “abcdeabcddacdef”;
char *sub = “abcd”;
int index = KMP(str,sub,0);
printf("%d\n",index);
return 0;
}

  • 4
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值