467. 环绕字符串中唯一的子字符串难度中等
把字符串 s 看作是“abcdefghijklmnopqrstuvwxyz”的无限环绕字符串,所以 s 看起来是这样的:"…zabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcd…".
现在我们有了另一个字符串 p 。你需要的是找出 s 中有多少个唯一的 p 的非空子串,尤其是当你的输入是字符串 p ,你需要输出字符串 s 中 p 的不同的非空子串的数目。
注意: p 仅由小写的英文字母组成,p 的大小可能超过 10000。
示例 1:
输入: “a”
输出: 1
解释: 字符串 S 中只有一个"a"子字符。
示例 2:
输入: “cac”
输出: 2
解释: 字符串 S 中的字符串“cac”只有两个子串“a”、“c”。.
示例 3:
输入: “zab”
输出: 6
解释: 在字符串 S 中有六个子串“z”、“a”、“b”、“za”、“ab”、“zab”。.
个人思路:
设置dp[i]用于存储以p[0],p[1]…p[i]构成的子字符串,其所满足该题的最优解
dp[i+1]=dp[i]+other,other由两种情况来判定:①新加入的1字字符未录入②新加入的字符是否与他之前的字符是连续的,同时也是未录入的
数组bool inStr[26+1][26+1]记录以经录入的子字符串,避免相同的子字符串重复录入,
inStr[n][m]表示长度为n,以字母’m:126对应az’是否已经录入
代码1.0:
class Solution {
public:
int findSubstringInWraproundString(string p) {
int len = p.size();
//dp[i]意为p字符串的前i个子字符串的最优解
vector<int> dp(len + 1,0);
//inStr用于记录已经录入的字符串
vector<vector<bool>> inStr(26+1, vector<bool>(26+1, false));
//第一个元素的特殊处理
dp[1] = 1;
inStr[1][p[0] - 96] = true;
//处理剩下的元素
for (int i = 2; i <= len; ++i)
{
dp[i] += dp[i - 1];
//判断新的“1长”元素是否已经录入过
if (inStr[1][p[i - 1] - 96] == false)
{
inStr[1][p[i - 1] - 96] = true;
++dp[i];
}
//判断新加入的字符是否能与前面的字符组成连续的字符串
if ((p[i - 1] - p[i - 2] != 1) && (p[i - 1] - p[i - 2] != -25)) continue;
int lenOfNewStr = 1;
for (int k = i; k >= 2; --k)
{
int differ = p[k - 1] - p[k - 2];
if (differ == 1 || differ == -25)
{
++lenOfNewStr;
if (inStr[lenOfNewStr][p[(k - 1) - (lenOfNewStr + 1)] - 96] == false)
{
inStr[lenOfNewStr][p[(k - 1) - (lenOfNewStr + 1)] - 96] = true;
++dp[i];
}
}
else
{
break;
}
}
}
return dp[len];
}
};
总结:想用空间换时间,但还是解释不了自己为啥蠢到要用27x27的矩阵来维护录入记录,在数据量小的时候会造成大量的空间浪费。可能自己第一时间想到的是当录入量大的时候,索引会比遍历要省很多时间。
代码2.0
class Solution {
public:
int findSubstringInWraproundString(string p) {
int len = p.length();
if(len<=1)
{
return len;
}
//dp[i]意为p字符串的前i个子字符串的最优解
vector<int> dp(len + 1,0);
//inStr用于记录已经录入的字符串
vector<string> inStr;
//第一个元素的特殊处理
dp[1] = 1;
inStr.push_back(p.substr(0, 1));
//处理剩下的元素
for (int i = 2; i <= len; ++i)
{
dp[i] += dp[i - 1];
//判断新的“1长”元素是否已经录入过
if (find(inStr.begin(),inStr.end(),p.substr(i-1,1))==inStr.end())
{
++dp[i];
inStr.push_back(p.substr(i - 1, 1));
}
//判断新加入的字符是否能与前面的字符组成连续的字符串
if ((p[i - 1] - p[i - 2] != 1) && (p[i - 1] - p[i - 2] != -25)) continue;
int lenOfNewStr = 1;
for (int k = i; k >= 2; --k)
{
int differ = p[k - 1] - p[k - 2];
if (differ == 1 || differ == -25)
{
++lenOfNewStr;
if (find(inStr.begin(),inStr.end(),p.substr(k-2,lenOfNewStr))==inStr.end())
{
++dp[i];
inStr.push_back(p.substr(k-2, lenOfNewStr));
}
}
else
{
break;
}
}
}
return dp[len];
}
};
使用迭代器和泛型算法来记录录入字符串,结果面对较长输入时超出时间限制
代码3.0:
在看了大佬们的代码后,发现可以用dp[26],来存储以26个字母为结尾的符合条件的子字符串数量,最后将他们累加起来。
class Solution {
public:
bool isConti(char before, char after)
{
if (after == 'z') return before=='a';
return before + 1 == after;
}
int findSubstringInWraproundString(string p) {
int len = p.size();
if (len <= 1) return len;
vector<int> dp(26, 0);
int k=0;
for (int i = 0; i < len; ++i)
{
if (i > 0 && isConti(p[i - 1], p[i]))
{
++k;
}
else
{
k = 1;
}
dp[p[i] - 'a'] = max(dp[p[i] - 'a'], k);
}
return accumulate(dp.begin(), dp.end(), 0);
}
};
反观代码2.0,超出时间限制的原因在于,当"a b c d"这一较长的连续子字符串纳入统计后,后面所有的较短如"b c d","c d"这些都会做无用功,导致大量的性能浪费,自己当时就是想不出来怎么解决这部分的性能浪费。