题目说明
实现strStr()
函数。
给定一个 haystack
字符串和一个 needle
字符串,在 haystack
字符串中找出 needle
字符串出现的第一个位置 (从
0
0
0 开始)。如果不存在,则返回
−
1
-1
−1。
说明:
当 needle
是空字符串时,我们应当返回什么值呢?这是一个在面试中很好的问题。
对于本题而言,当 needle
是空字符串时我们应当返回
0
0
0 。这与C语言的strstr()
以及 Java
的 indexOf()
定义相符。
测试样例
输入:haystack = “hello”, needle = “ll”
输出:2
输入:haystack = “aaaaa”, needle = “bba”
输出:-1
题意理解
简单的字符串处理题,只需要找到第一个出现的位置即可。
解题方案
这样的字符串匹配问题有很多种方法,暴力解决方法,人们熟悉的KMP算法等等。
这里对几种不错的方法做了实现:
常规解题法
对判断是否为子串不做任何优化,逐位比较。
class Solution {
public:
int strStr(string haystack, string needle) {
if(haystack.size()<needle.size())//小于模式串长度
return -1;
if(needle.size() == 0)//空串
return 0;
int last = haystack.size()-needle.size(),ns = needle.size();//定义最后一个比较元素的位置和模式串的长度
for(int i = 0;i<=last;i++){//遍历
if(haystack[i] == needle[0]){//进行匹配
if(haystack.substr(i,ns) == needle)
return i;
}
}
return -1;
}
};
Sunday算法
Sunday算法有点像简化版的KMP算法,但是判断依据上,Sunday算法采取对匹配串之后的一位字符进行判断。
先对模式串进行预处理,这一步的目的是找到每个字符所对应的偏移量。
Sunday算法对偏移量是这样定义的:
存储每个字符在串中最后出现的位置。
对匹配规则是这样规定的:
若匹配不成功:
- 如果匹配串的后一个元素不在模式串中,那么只需要直接在后一个元素之后匹配即可,即游标移动一个模式串长度。
- 如果匹配串的后一个元素在模式串中,则偏移到对齐位置,再进行比较。
若匹配成功,则返回当前游标。
class Solution {
public:
int strStr(string haystack, string needle) {
if(haystack.size()<needle.size())
return -1;
if(needle.size() == 0)
return 0;
int last = haystack.size()-needle.size(),ns = needle.size();
map<char,int> alph;
for(int i = ns-1;i>=0;i--){//构造偏移量
if(alph.find(needle[i]) == alph.end())
alph.insert(pair<char,int>(needle[i],ns-i));
}
for(int i = 0;i<=last;){
if(haystack.substr(i,ns)!=needle){//失配
if(alph.find(haystack[i+ns]) == alph.end())//若不在模式串中
i+=ns+1;
else
i+=alph.find(haystack[i+ns])->second;//偏移
}else
return i;
}
return -1;
}
};
我们可以看到,这两种算法其实在这种情况下运行时间差别不是很大,因为测试集中字符串较短小,测试用例很多,所以计算偏移量实际花费很多时间。
KMP算法较为晦涩难懂,实际应用中并不常见。
所有代码都可以在我的github上找到:LeetCode