昨天一群友在算法群中问了一道面试题:有一个长字符串T,有字符集S,找出T中包含所有的S中字符的最短子串。
当时已经接近午夜,群中人不多,没有激起太大的讨论。今天我想了一下,给出了一种比较笨的解法。
感觉上这是一个动态规划的问题,我的核心思想是,对于字符串中每一个的字符,若其不再字符集出现,则跳过;若其在字符集中出现,则遍历其后的字符串,求出对应的最短子串。这样,在遍历源串的过程中,记录最小子串的长度和起始位置。
代码如下: #include #include using namespace std; bool IsAllCharFromSetAppear(bool* pIsCharAppear, int iSetSize); int main(int argc, char* argv[]) { string strSource = "7348654767491203757389041568233074687"; const int iStrSize = strSource.length(); string strCharSet = "123457"; //假设字符集大小总是大于1,若为1,则讨论这个问题就没什么意义了 const int iSetSize = strCharSet.length(); int iMinPos = -1; //最短子串的起始位置 int iCurMinLength = iStrSize; //最短子串的长度,初始值为整个串的长度 bool* pIsCharAppear = new bool[iSetSize];//标记字符集中对应字符有无在子串中出现过 int i; for (i = 0; i 字符串中逐字符移动,对于每个字符,若其在字符集出现则找到其对应的最短子串 //若不是,则跳过 if (strCharSet.find(strSource[i]) == string::npos) {//若当前字符串中字符不再字符集中 continue; } //缩减查找距离,若查找长度超过当前最小子串的长度,则停止查找 temp = iCurMinLength 字符串中出现过 bool IsAllCharFromSetAppear(bool* pIsCharAppear, int iSetSize) { int i; for (i = 0; i 字符串的长度要小很多,可以忽略,因此算法还是可以看做是O(n2)的。
对于这个算法,我做了一个小小小小的优化;在第二个循环遍历后续串找最短子串时,我取当前最小子串的长度作为判断条件,因为,当查找长度超过当前最小子串长度后,搜索就没有意义了。
时间复杂度更低的算法肯定存在。暂时没有想到
当时已经接近午夜,群中人不多,没有激起太大的讨论。今天我想了一下,给出了一种比较笨的解法。
感觉上这是一个动态规划的问题,我的核心思想是,对于字符串中每一个的字符,若其不再字符集出现,则跳过;若其在字符集中出现,则遍历其后的字符串,求出对应的最短子串。这样,在遍历源串的过程中,记录最小子串的长度和起始位置。
代码如下: #include #include using namespace std; bool IsAllCharFromSetAppear(bool* pIsCharAppear, int iSetSize); int main(int argc, char* argv[]) { string strSource = "7348654767491203757389041568233074687"; const int iStrSize = strSource.length(); string strCharSet = "123457"; //假设字符集大小总是大于1,若为1,则讨论这个问题就没什么意义了 const int iSetSize = strCharSet.length(); int iMinPos = -1; //最短子串的起始位置 int iCurMinLength = iStrSize; //最短子串的长度,初始值为整个串的长度 bool* pIsCharAppear = new bool[iSetSize];//标记字符集中对应字符有无在子串中出现过 int i; for (i = 0; i 字符串中逐字符移动,对于每个字符,若其在字符集出现则找到其对应的最短子串 //若不是,则跳过 if (strCharSet.find(strSource[i]) == string::npos) {//若当前字符串中字符不再字符集中 continue; } //缩减查找距离,若查找长度超过当前最小子串的长度,则停止查找 temp = iCurMinLength 字符串中出现过 bool IsAllCharFromSetAppear(bool* pIsCharAppear, int iSetSize) { int i; for (i = 0; i 字符串的长度要小很多,可以忽略,因此算法还是可以看做是O(n2)的。
对于这个算法,我做了一个小小小小的优化;在第二个循环遍历后续串找最短子串时,我取当前最小子串的长度作为判断条件,因为,当查找长度超过当前最小子串长度后,搜索就没有意义了。
时间复杂度更低的算法肯定存在。暂时没有想到