问题现象
前几天写KMP算法时,测试样例时发生了错误。
#include <iostream>
#include <string>
using namespace std;
const int N = 100010;
int next_[N];
void getNext(const string& dest)
{
int i = 0, j = -1;
next_[0] = -1;
while (i < dest.size())
{
if (j == -1 || dest[i] == dest[j])
{
next_[++i] = ++j;
}
else
{
j = next_[j];
}
}
}
int KMP(const string& src, const string& dest)
{
int i = 0, j = 0;
getNext(dest);
while (i < src.size() && j < dest.size())
{
if (j == -1 || src[i] == dest[j])
{
i++, j++;
}
else
{
j = next_[j];
}
}
if (j == dest.size())
{
return i - j;
}
else
{
return -1;
}
}
int main()
{
string a, b;
cin >> a >> b;
cout << KMP(a, b) << endl;
return 0;
}
产生了不在预计范围内的示例:
University
sity
结果:
-1
我再次测试了一组示例:
aaaab
aab
结果:
2
这是没错的。
分析
后来发现在第一组样例中,程序的脚步只在KMP function中停留了一步就走了,这显然是错的。这时突然灵光乍现,啊呀,竟然犯了这个少见的错误。
string.size() 和 strlen()返回类型都是size_t,size_t 的本质其实是unsigned int 。
此时就出现了,unsigned 和 signed的比较,当然只要我们的signed的数是正数,其实比的话,不会发生什么意外的,关键就是这里的signed出现了负数,也就是这里的变量 j,它会变成-1呀。
简述一下在这次的unsigned与signed的比较中将会发生什么情况:
unsigned与signed之间会发生算术提升,结果是:signed会转化成unsigned,也就是-1会被当做是unsigned,即-1的反码(11111111 11111111 11111111 11111111)会被内存当做是原码来使用,结果明了了,string.size()铁铁地干不过这个小小的-1了。
那我的程序中的while直接在 j 变身成 unsigned 后直接被破了。
解决之道
强制类型转化一下就行了:
int srcLen = src.size(), destLen = dest.size();
//或
while (i < (int)src.size() && j < (int)dest.size())
{......}
其实,因为只有 j 会变成 -1,会涉及到 unsigned 与 signed 的比较,关于 j 的地方加上 (int) 的强制类型转化就行。
总结
当出现错误时,心里出现厌烦之气,不免想是不是编译器出现了错误呢?
看来还是自己的编码的不规范导致的。