28.实现strStr()
题目链接/文章讲解/视频讲解:代码随想录
1.代码展示
//28 找出一个字符串中第一个匹配项的下标
//寻找字符串的next数组(前缀表)
void getNext(vector<int>& next, string s) {
//step1 初始化前缀末尾、后缀末尾、next
//前缀末尾从首字符开始
int nFront = 0;
next[0] = 0;
//step2 开始遍历后缀末尾,初始为1
for (int nBack = 1; nBack < s.size(); nBack++) {
//当前缀末尾与后缀末尾不匹配时,前缀末尾要返回
//到next[nFront-1]处,直到出现匹配或者nFront = 0
while (nFront > 0 && s[nFront] != s[nBack]) {
nFront = next[nFront - 1];
}
//前缀末尾等于后缀末尾
if (s[nFront] == s[nBack]) {
nFront++;
}
//step3 给next赋值
next[nBack] = nFront;
}
}
int strStr(string haystack, string needle) {
//step1 获取needle的前缀表
if (needle.size() == 0) {
return 0;
}
vector<int> vnNext(needle.size());
getNext(vnNext, needle);
//step2 开始匹配
int nIndex = 0;
//遍历haystack
for (int i = 0; i < haystack.size(); i++) {
//当没匹配上时,needle下标后退
//直到匹配成功或者nIndex = 0
while (nIndex > 0 && needle[nIndex] != haystack[i]) {
nIndex = vnNext[nIndex - 1];
}
//当前字符匹配成功,进行下次匹配
if (needle[nIndex] == haystack[i]) {
nIndex++;
}
//整个字符串匹配成功
if (nIndex == needle.size()) {
return (i - needle.size() + 1);
}
}
return -1;
}
2.本题小节
本题是KMP的经典题目,KMP的经典思想就是:当出现字符串不匹配时,可以记录一部分之前已经匹配的文本内容,利用这些信息避免从头再去做匹配。使用KMP的话就一定要写next数组,next数组就是前缀表,前缀表是用来回退的,它记录了模式串与主串(文本串)不匹配的时候,模式串应该从哪里开始重新匹配。前缀表是什么?记录下标i之前(包括i)的字符串中,有多大长度的相同前缀后缀。
主要思路:首先要算出被寻找的字符串的前缀表,我这是单独写了一个getNext()函数,具体步骤看getNext()的实现过程。计算出被寻找字符串的前缀表后,开始对寻找字符串进行遍历,同时被寻找的字符串创建指针index,初始值为0,判断被寻找字符串当前字符与寻找字符串当前字符之间的关系,如果相同,则继续寻找,并将被寻找的字符串指针加1,如果不相同,进入while循环,index = next[index-1],避免从头进行匹配,直到index = 0或者相同退出while循环。当index等于被寻找字符串长度时,此时匹配成功,返回下标。
思考:要掌握前缀表的构造过程,虽然现在并不太能完全理解,但是也能理解一些。要理解被寻找字符串为什么需要计算前缀表,因为是为了避免从头开始计算,以及为什么不需要从头计算,可以通过动画来理解,index返回到next[index-1]之后,可以看到返回后的index之前的字符串依然是和寻找的字符串匹配的。
459.重复的子字符串
题目链接/文章讲解/视频讲解:代码随想录
1.代码展现
void getNext(vector<int>& next, string s){
//step1 初始化next和前缀末尾
int nFront = 0;
next[0] = 0;
//step2 遍历后缀末尾
for(int nBack = 1; nBack < s.size(); nBack++){
//当前后缀末尾不同时,前缀末尾前退
while(nFront > 0 && s[nFront] != s[nBack]){
nFront = next[nFront - 1];
}
//相同时
if(s[nFront] == s[nBack]){
nFront++;
}
//给next赋值
next[nBack] = nFront;
}
}
bool repeatedSubstringPattern(string s) {
//step1 求s的next前缀表
if(s.size() == 0){
return false;
}
int nLen = s.size();
vector<int> vnNext(nLen);
getNext(vnNext, s);
//step2 检查字符串
if(vnNext[nLen - 1] != 0 && nLen % (nLen - vnNext[nLen - 1]) == 0){
return true;
}
return false;
2.本题小节
主要思路:本题依然用到了KMP的方法,主要用到的是最大相同前后缀长度,如果一个字符串是由多个重复的子字符串相连得到的,那么这个字符串的最大后缀长度为字符串长度减去子字符串的长度,因此字符串长度对子字符串长度取余为0。因此本题首先计算出字符串的前缀表,通过前缀表中最大的相同前后缀长度计算出子字符的长度,然后用字符串长度对子字符串长度取余,如果为0,则返回true,否则false。
思考:这里的重点是如果一个字符串是由多个重复的子字符串相连得到的,那么这个字符串的最大后缀长度为字符串长度减去子字符串的长度,这个要想清楚。这个next数组用得很巧妙。
字符串总结
题目链接/文章讲解:代码随想录
双指针回顾
文章讲解:代码随想录
数组的删除(覆盖)用到了双指针,删减的话从前往后遍历;字符串的反转用到首尾指针,增加用到的双指针,从后往前遍历;链表的反转用得双指针,从前往后遍历,改变指向。链表找环入口用的是快慢指针,快指针在环中追上慢指针;n数之和用到了前后指针,在数组排序后,用来调整和的大小到指定值;