C++ KMP算法

通过一个prefix数组,用来保存最长公共前后缀的长度,这样在每次回溯时,可以减少回溯的长度。

text:用来匹配的字符数组

pattern:要查找的字符数

prefix:匹配值(默认prefix[0]=0)

pattern
ABABCABAA
text
ABABABABCABAAB

对于pattern来说:

AB的最大公共前后缀 0;

ABA的最大公共前后缀 1;

ABAB的最大公共前后缀 2;

ABABC的最大公共前后缀 0;

ABABCA的最大公共前后缀 1;

ABABCAB的最大公共前后缀 2;

ABABCABA的最大公共前后缀 3;

ABABCABAA的最大公共前后缀 1;

部分匹配表
ABABCABAA
001201231

prefix
001201231

则编写prefix的代码:

void prefix_table(char pattern[], int prefix[], int n)
{
	prefix[0] = 0;
	int len = 0;//最长公共前后缀长度
	int i = 1;
	while (i < n)
	{
		if (pattern[i] == pattern[len])
		{
			len++;
			prefix[i] = len;
			i++;
		}
		else
		{
			if (len > 0)
			{
				len = prefix[len - 1];
			}
			else
			{
				prefix[i] = len;
				i++;
			}
		}
	}
}

为了后面方面写kmp算法,将prefix整体右移一位,前面补-1:

void move_prefix_table(int prefix[],int n)
{
	for (int i = n - 1; i > 0; i--)
	{
		prefix[i] = prefix[i - 1];
	}
	prefix[0] = -1;
}

kmp算法:

void kmp_search(char text[], char pattern[])
{
	int i = 0;
	int pattern_count = 0;
	int text_count = 0;
	while (pattern[i] != '\0')
	{
		i++;
		pattern_count++;
	}
	cout <<"pattern_count="<< pattern_count << endl;
	i = 0;
	while (text[i] != '\0')
	{
		i++;
		text_count++;
	}
	cout << "text_count=" << text_count << endl;
	int *prefix = new int[sizeof(int)*pattern_count];
	prefix_table(pattern, prefix, pattern_count);
	move_prefix_table(prefix, pattern_count);
	for (int i = 0; i < pattern_count; i++)
	{
		cout << prefix[i] << "  ";
	}
	cout << endl;
	i = 0; //主串索引
	int j = 0; //查找串索引
	while (i < text_count)
	{
		if (j == pattern_count - 1 && text[i] == pattern[j])
		{
			cout << "Found pattern at " << i - j << endl;
			j = prefix[j];
		}
		{

		}
		if (text[i] == pattern[j])
		{
			i++;
			j++;
		}
		else
		{
			j = prefix[j];
			if (j == -1)
			{
				i++;
				j++;
			}
		}
	}
}

完整代码:

void prefix_table(char pattern[], int prefix[], int n)
{
	prefix[0] = 0;
	int len = 0;//最长公共前后缀长度
	int i = 1;
	while (i < n)
	{
		if (pattern[i] == pattern[len])
		{
			len++;
			prefix[i] = len;
			i++;
		}
		else
		{
			if (len > 0)
			{
				len = prefix[len - 1];
			}
			else
			{
				prefix[i] = len;
				i++;
			}
		}
	}
}

void move_prefix_table(int prefix[],int n)
{
	for (int i = n - 1; i > 0; i--)
	{
		prefix[i] = prefix[i - 1];
	}
	prefix[0] = -1;
}

void kmp_search(char text[], char pattern[])
{
	int i = 0;
	int pattern_count = 0;
	int text_count = 0;
	while (pattern[i] != '\0')
	{
		i++;
		pattern_count++;
	}
	cout <<"pattern_count="<< pattern_count << endl;
	i = 0;
	while (text[i] != '\0')
	{
		i++;
		text_count++;
	}
	cout << "text_count=" << text_count << endl;
	int *prefix = new int[sizeof(int)*pattern_count];
	prefix_table(pattern, prefix, pattern_count);
	move_prefix_table(prefix, pattern_count);
	for (int i = 0; i < pattern_count; i++)
	{
		cout << prefix[i] << "  ";
	}
	cout << endl;
	i = 0; //主串索引
	int j = 0; //查找串索引
	while (i < text_count)
	{
		if (j == pattern_count - 1 && text[i] == pattern[j])
		{
			cout << "Found pattern at " << i - j << endl;
			j = prefix[j];
		}
		{

		}
		if (text[i] == pattern[j])
		{
			i++;
			j++;
		}
		else
		{
			j = prefix[j];
			if (j == -1)
			{
				i++;
				j++;
			}
		}
	}
}

int main()
{
	char text[] = "ABABABABCABAAB";
	char pattern[] = "ABABCABAA";
	kmp_search(text, pattern);

	system("pause");
	return 0;
}

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值