昨天一群友在算法群中问了一道面试题:有一个长字符串T,有字符集S,找出T中包含所有的S中字符的最短子串。
当时已经接近午夜,群中人不多,没有激起太大的讨论。今天我想了一下,给出了一种比较笨的解法。
感觉上这是一个动态规划的问题,我的核心思想是,对于字符串中每一个的字符,若其不再字符集出现,则跳过;若其在字符集中出现,则遍历其后的字符串,求出对应的最短子串。这样,在遍历源串的过程中,记录最小子串的长度和起始位置。
代码如下:
算法的思想其实很简单,时间复杂度乍一看是O(n2)。如果算上调用string.find(),即遍历字符集查找指定字符,那么时间复杂度就是O(n3)。但是一般来说,字符集的规模相对于字符串的长度要小很多,可以忽略,因此算法还是可以看做是O(n2)的。
对于这个算法,我做了一个小小小小的优化;在第二个循环遍历后续串找最短子串时,我取当前最小子串的长度作为判断条件,因为,当查找长度超过当前最小子串长度后,搜索就没有意义了。
时间复杂度更低的算法肯定存在。暂时没有想到