unsigned与signed的不期而遇——KMP算法中应该规避的错误

unsigned与signed的不期而遇

问题现象

前几天写KMP算法时,测试样例时发生了错误。

#include <iostream>
#include <string>
using namespace std;
const int N = 100010;
int next_[N];
void getNext(const string& dest)
{
	int i = 0, j = -1;
	next_[0] = -1;
	while (i < dest.size())
	{
		if (j == -1 || dest[i] == dest[j])
		{
			next_[++i] = ++j;
		}
		else
		{
			j = next_[j];
		}
	}
}
int KMP(const string& src, const string& dest)
{
	int i = 0, j = 0;
	getNext(dest);
	while (i < src.size() && j < dest.size())
	{
		if (j == -1 || src[i] == dest[j])
		{
			i++, j++;
		}
		else
		{
			j = next_[j];
		}
	}
	if (j == dest.size())
	{
		return i - j;
	}
	else
	{
		return -1;
	}
}
int main()
{
	string a, b;
	cin >> a >> b;
	cout << KMP(a, b) << endl;
	return 0;
}

产生了不在预计范围内的示例:

University
sity

结果:
-1
我再次测试了一组示例:

aaaab
aab

结果:
2
这是没错的。

分析

后来发现在第一组样例中,程序的脚步只在KMP function中停留了一步就走了,这显然是错的。这时突然灵光乍现,啊呀,竟然犯了这个少见的错误。

string.size() 和 strlen()返回类型都是size_t,size_t 的本质其实是unsigned int 。

此时就出现了,unsigned 和 signed的比较,当然只要我们的signed的数是正数,其实比的话,不会发生什么意外的,关键就是这里的signed出现了负数,也就是这里的变量 j,它会变成-1呀。

简述一下在这次的unsigned与signed的比较中将会发生什么情况:

unsigned与signed之间会发生算术提升,结果是:signed会转化成unsigned,也就是-1会被当做是unsigned,即-1的反码(11111111 11111111 11111111 11111111)会被内存当做是原码来使用,结果明了了,string.size()铁铁地干不过这个小小的-1了。

那我的程序中的while直接在 j 变身成 unsigned 后直接被破了。

解决之道

强制类型转化一下就行了:

int srcLen = src.size(), destLen = dest.size();
//或
while (i < (int)src.size() && j < (int)dest.size())
{......}

其实,因为只有 j 会变成 -1,会涉及到 unsigned 与 signed 的比较,关于 j 的地方加上 (int) 的强制类型转化就行。

总结

当出现错误时,心里出现厌烦之气,不免想是不是编译器出现了错误呢?

看来还是自己的编码的不规范导致的。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

FeatherWaves

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值