问题:
有一个字符串数组,将数组中的每一个字符串按照字母序排序;之后再将整个字符串数组按照字典序排序。整个操作的时间复杂度是多少?
分析:
- 假设最长的字符串长度为 s (为什么要假设最长字符串呢?因为通常求的时间复杂度是上界,所以我们假象这个字符串数组中所有字符串的长度都是最长的 s ,这样计算得出来的时间复杂度就是上界,包含了最坏的情况);数组中有 n 个字符串
- 我们将计算分为两部分:一部分是计算每个字符串按照字母序排序的时间复杂度;另一部分是计算将整个字符串数组按照字母序排序的时间复杂度。
- 因为对每个单独的字符串排序:O(slogs),所以将数组中的每一个字符串都按照字母序排序:O(n * slog(s))
- 将整个字符串数组按照字典序排序:O(s * nlog(n))
注意这里比较的是字符串,所以在按照字典序排序的时候还需要消耗每个字符串的长度 - 将这两部分的计算结果合并:O(n * slog(s)) + O(s * nlog(n)) = O(n * s * logs + s * b * logn)
总结
通常,一个算法如果由两部分组成,那么整个算法的时间复杂度应取复杂度最大的那个。
e.g. O(nlogn + n) = O(nlogn)
这么计算的前提是这两部分处理的规模 n 是一样的,如果对于 O(AlogA + B) 这种情况,因为 A 和 B 没有关系,我们就没有办法确认 A 和 B 谁的规模大,所以不能确认以哪个为主。
比较常见的一个例子就是对邻接表实现图的遍历的情况,其时间复杂度为 O(V + E),V 和 E 没有必然联系,所以彼此不能替换。除非是一个完全图 or 稠密图,此时 E 近乎是 V^2 级别,此时时间复杂度就是 O(V^2) ,这也是用邻接矩阵实现图的遍历时的复杂度,但是通常用邻接表处理的都是一些稀疏图。总之,就是 V 和 E 是两个不同的规模,不能混为一谈,在考虑时间复杂度时需要考虑类似这样的情况。