查找字符串问题经久不衰。最普通的BF朴素查找算法,在目标串中查找子串,按位置查找,查找出错则返回目标串开始查找位置的下一位置继续查找。该算法是最简单但是效率最低的。复杂度m*n。
kmp算法维护一个查找数组,通过该数组在查找失败的时候确定子串下次比较的位置。参考文章:https://blog.csdn.net/qq_38701476/article/details/81512525
bm算法通过坏字符与好后缀确定匹配失败时子串移动的位置。他一般有两个规则,1、出现坏字符的时候,如果子串中存在该字符,则将母串中该字符与子串里最右边字符与其对其。如果不存在,则整片跳过。2、出现好后缀的时候,如果子串中存在,则将母串中好后缀与子串中最右边好后缀对其。如果不存在,整片跳过。参考文章:http://www.ruanyifeng.com/blog/2013/05/boyer-moore_string_search_algorithm.html
sunday算法,相比kmp和bm算法理解起来就容易得多。核心思想便是尽可能的跳过不需要比较的区域。目标串与子串从左向右移动,但是从右向左比较,当比较失败的时候,确定母串中该字符是否在子串存在,存在则移动到该字符的位置,不存在则整片跳过。
母串:1 3 4 5 6 7 8
子串:5 9 9 6
母串与子串进行比较,从右向左。5与6比较失败,子串中存在5,则子串中的5与母串中5对其。如果不存在,则子串中5与母串中7对齐。
void sunday_test()
{
string strSrc = "qwyrjshdfwe7234gqyerb23bhufebhu";
string strDes = "bhu";
int iLenSrc = strSrc.length();
int iLenDes = strDes.length();
vector<int> veNext;
for (int i = 0; i < 256; ++i)
veNext.push_back(iLenDes + 1);
for (int i = 0; i < iLenDes; ++i)
veNext[strDes[i]] = iLenDes - i;
for (int i = 0; i < iLenSrc - iLenDes; i += veNext[strSrc[i + iLenDes]])
{
int j = 0;
while (j < iLenDes)
{
if (strSrc[i + j] != strDes[j])
break;
++j;
}
if (j == iLenDes)
{
cout << "pos: " << i << endl;
}
}
}