数据结构:BF算法、KMP算法

       BF算法,即暴风(Brute Force)算法,是普通的模式匹配算法,BF算法的思想就是将目标串S的第一个字符与模式串T的第一个字符进行匹配,若相等,则继续比较S的第二个字符和 T的第二个字符;若不相等,则比较S的第二个字符和T的第一个字符,依次比较下去,直到得出最后的匹配结果。BF算法是一种蛮力算法。

该算法最坏情况下要进行M*(N-M+1)次比较,时间复杂度为O(M*N)。

 

      KMP算法要解决的问题就是在字符串(也叫主串)中的模式(pattern)定位问题。说简单点就是我们平时常说的关键字搜索。模式串就是关键字(接下来称它为P),如果它在一个主串(接下来称为T)中出现,就返回它的具体位置,否则返回-1(常用手段)。

      KMP算法是一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和V.R.Pratt同时发现,简称KMP算法,KMP算法的关键是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。具体实现就是实现一个next()函数,函数本身包含了模式串的局部匹配信息。

时间复杂度O(m+n)。

 

BF实现:
 

//查找子串
int BF(PString ps, PString pp)
{
	if (ps == NULL || pp == NULL)
	{
		return -1;
	}
	int i = 0;
	int j = 0;
	while (i < ps->curlen && j < pp->curlen)
	{
		if (ps->pstr[i] == pp->pstr[j])
		{
			i++;
			j++;
		}
		else
		{
			i = i - j + 1;
			j = 0;
		}
	}
	if (j >= pp->curlen)
	{
		return i - j;
	}
	return -1;
}

KMP算法:

void GetNext(PString ps, int* next)
{
	if (ps == NULL)
	{
		return;
	}
	int k = -1;
	int i = 1;
	int len = ps->curlen;

	if (len == 0)
	{
		return;
	}
	next[0] = -1;
	if (len == 1)
	{
		return;
	}
	next[1] = ++k;

	while (i < len - 1)
	{
		if (k == -1 || ps->pstr[i] == ps->pstr[k])
		{
			//next[i + 1] = k + 1;
			//i++;
			//k++;
			next[++i] = ++k;
		}
		else
		{
			k = next[k];
		}
	}
}

int KMP(PString ps1, PString ps2)
{
	if (ps1 == NULL || ps2 == NULL)
	{
		return -1;
	}
	int len1 = ps1->curlen;
	int len2 = ps2->curlen;
	int i = 0;
	int j = 0;
	int* next = (int*)malloc(sizeof(int)*len2);
	GetNext(ps2, next);

	while (i < len1 && j < len2)
	{
		if (j == -1 || ps1->pstr[i] == ps2->pstr[j])
		{
			++i;
			++j;
		}
		else
		{
			j = next[j];
		}
	}
	free(next);
	if (j >= len2)
	{
		return i - j;
	}
	return -1;
}

 

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值