【人人都能看懂的漫画算法】边打扑克边学插入排序算法，彻底搞懂时间复杂度

本文链接：https://blog.csdn.net/liyiming2017/article/details/131967677

博主：爱码叔
个人博客站点： icodebook.com
公众号：爱码叔漫画软件设计（搜：爱码叔）
微博：程序员涛哥
专注于软件设计与架构、技术管理。擅长用通俗易懂的语言讲解技术。对技术管理工作有自己的一定见解。文章会第一时间首发在个站上，欢迎大家关注访问！

写在前面的话

今天我开了一个新的专栏，关于算法。算法的教材和文章相当的多，为什么我还要做这个专栏呢？

首先算法比较复杂，复杂在思想上，复杂在大量数学知识的运用上。因此市面上有些非常优秀的书，讲的很细，内容很全，但是门槛比较高。还有些算法书非常薄，但只讲了部分算法的思想，给出了实现代码而已。甚至连时间复杂度的 “O” 标记都没有解释。又让我觉得过于精简了。于是我萌生了写自己心目中算法应该怎么讲的文章。

再说说本专栏的文章形式。大概一年半前，我第一次尝试用漫画的形式创作了几篇关于安全的文章。
《图文结合彻底理解非对称加密、RSA原理及安全性》

《加密就像玩魔方----图文详解对称加密》

《图文轻松理解计算机网络五层架构》

反响还不错。于是我想尝试挑战用漫画的形式创作算法专栏。

虽然工作中很少使用算法，但却是程序员的必须课。希望看我的算法专栏能让读者更为轻松的学习到算法知识！

专栏的内容会参考《算法导论》、《算法》等经典著作，将里面经典的内容以通俗易懂的形式，并辅以大量插图呈现给大家。

文章中有两位虚拟人物：

经验丰富的老司机程序员----熊小猫
初入职场激情满满的菜鸟程序员----兔小白

让我们跟随兔小白和熊小猫一起走入算法的世界！

下面开始第一篇正文

边打扑克边学插入排序算法，彻底搞懂时间复杂度

什么是算法、什么是时间复杂度、时间复杂度中的O标记是什么意思、如何分析算法的时间复杂度？咱们跟着兔小白和熊小猫，边打扑克边学！基础知识掌握好，后面学到复杂算法才会更从容！
在这里插入图片描述
熊小猫：晚上放松下，来我家打牌怎么样？

兔小白：不去了，我已经计划从今晚开始学习算法

熊小猫：在游戏中学习效果最好！其实抓牌的过程就存在一个算法！

兔小白：哦！？难道有抓到好牌的算法？

熊小猫：想什么呢！你说的是出老千！

兔小白：嘿嘿…

熊小猫：抓牌时候是不是要按顺序排放你手中的牌？这里就用到了插入排序。

兔小白：啊，之前我面试挂了，考的就是插入排序！没想到我打了20年扑克牌，竟然一直都在实践插入排序！？

熊小猫：今晚打完扑克，包你彻底掌握插入排序！

插入排序如何工作

下班后，兔小白来到了熊小猫家里打扑克。

兔小白：来吧！讲讲插入排序，请开始你的表演！

熊小猫：别着急，我先发牌。发完后，你再摸牌。边摸边思考下摸牌的过程。

兔小白：手里的牌需要从小到大排列，每次我摸牌后都会从小的一侧开始比较，直到找到比我抓到的牌大的那一张，然后插在那一张牌的前面
在这里插入图片描述
熊小猫：没错！这就是插入排序。我们仔细看看这个过程。

熊小猫：插入排序是不是很简单？你看看能不能用代码实现？

兔小白：等等！我的牌不错，先打完这局！

插入排序代码

熊小猫：你这牌也太好了，我认输了。

兔小白：作为惩罚，再给我讲讲代码实现吧？

熊小猫：没问题！咱先写一种最自然地，符合我们直觉地摸牌算法。首先你从牌堆里抓出一张牌，然后从左向右和手牌进行比较，找到比你抓到的牌大的那一张，你会把这张牌插入到它的前面。如果找到手牌的牌尾还没找到，那么放到牌尾。

兔小白：我想想…没错，确实我抓牌时候非常自然地就是这么做的! 但从你嘴里以这么严谨的逻辑说出来，我还得理解一下，嘿嘿！

熊小猫：那我们就按照这个逻辑写代码。

public static Integer[] sort(Integer[] unsorted) {
    //sorted数组可以理解为拿着排好序手牌的"手"
    Integer[] sorted = new Integer[unsorted.length];
    //第一张牌什么都不用想，放入手中
    sorted[0] = unsorted[0];
    //从第二张牌开始要逐张找到其顺序的位置放入
    for (int i = 1; i < unsorted.length; i++) {
        //摸起一张牌，从左侧开始比较，找到插入的位置。最差的情况要找到手牌的牌尾
        for (int j = 0; j <= i; j++) {
            //如果已经找到手牌牌尾或者中途找到手牌中比当前牌大的那张牌
            if (j==i || unsorted[i] < sorted[j]) {
                //比当前大的那张牌以及后面的牌向后移一位
                for (int k = i-1; k >= j; k--) {
                    sorted[k + 1] = sorted[k];
                }
                //将当前牌放入移动后空出来的那个位置。
                sorted[j] = unsorted[i];
                //本轮结束
                break;
            }
        }
    }
    return sorted;
}

兔小白：注释都有了！但我还是看不太懂。

熊小猫：其实很好理解，咱们跟着注释一行行的看。

函数的输入是一个无序的整型数组 unsorted，可以理解为桌面牌堆
第3行初始化的整型数组 sorted，可以理解为你的“手”，用来放排好序的牌。这里记住，手中牌是 sorted 中放的牌，桌面牌堆是 unsorted 中放的牌。
第5行代码是你抓出第一张牌时，手里还是空的。所以直接放入你的手里，也就是 sorted 的0号位置。
第7行开始进入主要的算法逻辑。从第二张牌开始，逐一找到自己的位置放进来。直到抓完所有的牌，也就是循环完 unsorted。
1. 摸起一张牌 unsort[i]，然后从左向右，和手中牌比较大小。摸起的是第 i 张牌时，你手中有 i-1 张牌。但最差的情况要比较 i 次，因为如果很不幸，你拿到的牌比手里的 i-1 牌都大，要再比较一次以判断是否走到现有手牌的牌尾。（第9行代码）
2. 第 11 行代码，就是在比较摸起的牌和手里的牌，目的是找到比摸起的牌大的牌的位置 j。条件语句中的 j==i 表示找到手牌牌尾也没有找到比摸到的牌更大的牌。
3. 13-15 行这个循环体做的事情是，将 sorted 中 j 位置后面的牌往后移一位，空出 j 这个位置，用来放摸到的牌。
4. 17 行代码便是将抓的牌放入手中正确的位置 sorted[j]
5. 19 行的 break 表示一轮插入逻辑结束，也就是第 9 行的 for 循环结束。此时已经将这次抓到的牌放入手牌中正确位置。

如此往复 4.1～4.5，直到所有 unsorted 中的元素都有序的放入 sorted。

兔小白：代码逻辑和我抓牌时脑子里想的一模一样！！我脑子只是转了一下，代码表达出来居然写了这么多？

熊小猫：哈哈，别看代码多，但计算机执行起来可比你脑子快的多！

兔小白：我突然想到有时候我会先把牌堆的牌全拿到手中再排顺序。这样排序会不会更快？

熊小猫：这个问题的本质是如何评价算法，解决问题的办法不止一种，如何评价哪种更好呢？通常我们使用算法复杂度来评价算法。

兔小白: 算法复杂度？说来听听？

熊小猫：别急，上面我给出的算法并不是最经典的插入排序。我再送你一份经典的插入排序代码，加量不加价！这个算法就是你说的把牌全部拿到手中再排序，这样就只需一个数组，节省了存储空间。
算法的主要逻辑是，从第二个元素开始，和前面的元素逐一比较，如果自己较小，就和前面的交换位置，然后再继续和前面的比较。直到找到前面比自己还小的那个元素，就停在当前的位置，然后开始下一轮循环。

代码如下，你先自己研究下，看明白后加上注释。

public static Integer[] sortV2(Integer[] unsorted) {
    for (int i = 1; i < unsorted.length; i++) {
        for (int j = i; j > 0 && unsorted[j] < unsorted[j - 1]; j--) {
            Integer toBeSortedNumber = unsorted[j];
            unsorted[j] = unsorted[j - 1];
            unsorted[j - 1] = toBeSortedNumber;
        }
    }
    return unsorted;
}

兔小白：考我是吧？就这几行代码，五分钟搞定！

五分钟后兔小白给代码加上了注释

public static Integer[] sortV2(Integer[] unsorted) {
    //从第二个元素开始，向后逐一执行排序逻辑
    for (int i = 1; i < unsorted.length; i++) {
        //从待排序元素的位置开始，向前逐一比较。比自己大就交换位置，比自己小停止循环。
        for (int j = i; j > 0 && unsorted[j] < unsorted[j - 1]; j--) {
            //如果前一个元素比当前元素大，那么交换两个元素的位置
            Integer toBeSortedNumber = unsorted[j];
            unsorted[j] = unsorted[j - 1];
            unsorted[j - 1] = toBeSortedNumber;
        }
    }
    return unsorted;
}

熊小猫：这个代码是不是简洁多了。下面咱们再聊聊算法的复杂度。

如何评价算法？

兔小白：我经常听别人讨论算法复杂度。什么是算法复杂度？是算法代码的行数吗？

熊小猫：代码行数？你别闹。。。通常算法复杂度包括时间复杂度和空间复杂度。下面我慢慢解释。
算法用来解决问题。生活中也有各种各样的问题要解决。比如我从北京开车去北戴河应该怎么走。线路的选择有很多。有的路程虽然远，但是车少、路好走，所以时间短。有的路程虽然近很多，但是车多拥堵，导致时间反而更长。
在这里插入图片描述
看完这个例子，如何评判算法优劣，相信我们心里已经有数。

首先是算法的速度，也就是解决问题所消耗的时间。这就是我们常说的“时间复杂度”

然后是算法消耗的资源，例子中是公路，资源是要付出代价的，体现在油费和高速费。对于算法来说，运算中消耗的资源是计算机的存储。计算过程中使用的存储数量，就是 “空间复杂度”。

你一定听说过“以时间换空间”或者“以空间换时间”。算法中的也有这个概念，牺牲更大的存储空间换取更短的运算时间，或是以更长的运算时间换取更小的存储使用。

究竟是时间优先还是空间优先，这取决于你手里的资源。如果你想更快到达北戴河，甚至可以乘坐直升飞机，但是成本飙升。我们永远渴望更快的运算速度，但是又被成本所牵制。不过在这个存储非常廉价的时代，可以更多考虑运算时间。

除了时间复杂度和空间复杂度外，还可以从以下几个方面评价算法的优劣。

易读性。代码是否简洁、易读，便于维护。从工程角度看，这一点非常重要。
健壮性。对于非法输入是否有足够的包容性。
安全性。算法是否有安全漏洞，可以被利用、攻击。尤其是安全相关的算法。

这几点主要在工程实践、非功能性需求等方面对算法提出近一步要求。
我们回归到算法本身，算法的评判标准是时间复杂度和空间复杂度。

时间复杂度

熊小猫：正如汽车的性能不一样，计算机的性能也不一样。对于时间的度量，需要在统一标准的机器上进行。我们假设这台机器基本的指令（算术、移动、控制）都能在常量时间内运行完成。

算法运行的时间一般和输入规模同步增长。10牌排序肯定快于50张牌。因此，一般将运算时间用输入规模的函数表达。

咱们看个很简单的例子。还是打扑克，我现在出 K，你需要出比K大的牌管上我。假设这个扑克牌玩法只能单张出牌，每人手里10张牌（虽然很愚蠢，但能简化理解），并且已经排好序。这里给出一个最直观地出牌算法：从第一张开始逐张进行比较，如果小于等于 K，继续比较下一张，直到找到大于 K 的牌打出此牌。如果找到牌尾没有找到，则告知对方不出牌。

假设你手里有n张牌，那么输入规模就是n。每次比较所消耗的时间是 t1，找到牌后选择出牌或者告知对方不出牌消耗时间t2。我们考虑最差的情况，会比较完手里的所有牌。此时消耗的时间是n*t1，算法的时间函数如下。

T(n) = t1*n + t2

这是一个非常精准的时间计算。但在计算机领域，我们更关心的是运行时间随 n 的增长率或者增长量级。因此可以忽略掉常数项、低阶项、常数系数。我们可以看个例子感受一下。

假设我们有另外一个出牌算法，时间函数为

T’(n) = c1*n^2+c2

即使 t1 比 c1 大很多，t2 也比 c2 大很多，也终究无法改变一个事实：当 n 足够大时，T‘(n) 将永远超越T(n)。通过下面这个示意图可以直观的感受这个结论。
在这里插入图片描述
可以看出常数项和常数系数并不重要。因此，我们比较算法的时间复杂度时，通常将常数项以及常数系数忽略掉。但不可以将 T(n) = t1*n + t2 转化为 T(n) = n 。正确的写法是 T(n) = O(n)。

兔小白：我理解函数的最高阶项决定了他的增长量级，低介项和常量系数可以忽略。

熊小猫：没错，理解的很到位！

兔小白：但是这个 “大欧” 是什么符号？我确实见过 T(n) = O(n) 这种写法，不过一直不理解。

熊小猫：别急，接下来我们就看看记号 “大欧”。

O记号

熊小猫：“大欧” 用来标记一个函数的渐进上界。前面讲过算法时间函数的增长量级可以用来比较算法的时间复杂度。那么渐进上界和增长量级是一回事吗？我们先来看看什么是渐进上界。
看下图的两个函数 f(n)=t1*n + t2 及 g(n)=n。

在这里插入图片描述
当我们将g(n)乘以一个大于1的系数c，得到一个新的函数cg(n)。

可以看到在相交点 n0 后，对于所有 n ，都有 cg(n)>f(n)。这就是渐进上界的定义。对于给定的函数 g(n), 如果存在正常量 c和n0 使得对所有 n>n0, 有 0<=f(n)<=cg(n)，那么 g(n) 就是 f(n) 的渐进上界。 记作 f(n)=O(g(n))。

单看文字定义，你一定云里雾里。我们来看上面的图，当g(n)乘以一个大于0的系数c后，cg(n)的线会比f(n)更为陡峭，这意味着在某个点n0，cg(n)的线将永远在f(n)的上方。

兔小白：等等，这里我有个问题，根据渐进确界的定义，t1*n + t2=O(n^2) 也是成立的，你看下面我画的图，完全符合定义！
在这里插入图片描述
但是 t1 * n^2+ t2 的渐进上界也是 O(n^2) 。那么渐进上界就无法用来比较时间复杂度。

熊小猫：这个问题非常非常好！渐进上界并不能准确描述一个函数的增长量级。其实很多算法书中将O用作标记渐进紧确界（标准的标记应该用Θ）。渐进紧确界除了满足渐进上界的要求之外，还需要存在c‘使得所有 n>n0, 有cg(n)>f(n)>c’g(n)。 文字太抽象，还是看图吧。
在这里插入图片描述
函数 cn^2，即使c再小，终究还是会高过 t1n + t2 。所以 g(n)=n^2 不满足对 f(n)= t1*n + t2 的渐进紧确界的定义。但函数 g(n)=n 满足定义，因此 n=O(n) 成立，但 n=O(n^2) 是错误的。

兔小白：明白了，我们通常看的算法书中把O用作标记渐进紧确界而不是渐进上界。

熊小猫：没错，函数的渐进紧确界可以代表它的增长趋势。因为通过调整 g(n) 的系数 c 只能另函数曲线更陡峭或更平缓，但不会改变增长趋势。也就是说不会改变匀速增长、加速增长、减速增张的大趋势。
如果当n无穷大时，f(n)仍不能越界出 cg(n) 和 c‘g(n)，而是被死死的夹住了。那么可以认为g(n)代表了f(n)的增长趋势，这就是为什么我们可以用T(n)的渐进紧确界来表示算法的时间复杂度。

兔小白：说实话数学这块把我搞得有点晕。虽然勉强能听懂，但用的时候恐怕又忘了。有没有简单的办法快速得到函数的渐进紧确界。

熊小猫：哈哈，这个其实最开始就说过了，通常来说，你把函数的常数项、低介项、常数系数去掉就可以了。

兔小白：这么简单？你看看我这几个算的对不对？

an^2 + bn + c=O(n^2)
nlgn+an+c = O(lgn)

熊小猫：第一个没问题，第二个错啦！应该是 O(nlgn)。n 并不是常数系数，需要保留。

兔小白：大意了！咱们说了半天还没说插入算法的时间复杂度呢。

熊小猫：别急，干任何事情都要打好基础，咱们这就看看插入算法的时间复杂度。

插入排序时间复杂度

熊小猫：基础打好了，我们来看看插入排序的时间复杂度。先问个问题，摸牌这个阶段的时间消耗每次都一样吗？

兔小白：当然不一样，有时候我着急就会摸的快一点！
在这里插入图片描述
熊小猫：不是这个意思…我是说每次找到插入位置所需的比较次数是固定的吗？

兔小白：当然不是，如果运气好，每次都比第一张牌小，那么每次都只需要比较一次。但是运气不好摸出一张比手里牌都大的牌，那么就要比较所有手里的牌，最后放到牌尾。

熊小猫：没错！如果牌堆里的牌是逆顺序排好，最大的牌在最上面，那么每次摸牌我都只需要比较一次。反之如果牌堆里的牌是顺序排好，最小的在最上面，那么每次摸牌都要比较手里所有的牌。

兔小白：碰到这种情况，我很快就会发现规律，我会改为从手中牌的右侧开始比。还是非常快！

熊小猫：你这已经改变算法啦！如果给算法加上智能，也不是不行，今天咱们不讨论这个。

我们讨论算法的时间复杂度，一般是看的最坏情况。也就是算法最长的运行时间。这和你评估工作量一样，3-5天的工作量，你肯定报5天。

兔小白：别提了，工作量我就没估准过，每次都是加班才搞定。

熊小猫：我们先计算算法消耗的总时间。算法中每个操作消耗的时间算然不同，但为常量。我们再分析出每个操作步骤执行的次数。两者相乘，得到一个步骤的总时长。再把所有操作步骤的消耗加起来就能得到运行时间的函数。另外由于消耗的时间是常量，根据渐进紧确界的特性，常量和常数系数是可以忽略的，那么我们只需要关心总的执行次数即可。
我们来分析第一版算法代码的运算次数。

public static Integer[] sort(Integer[] unsorted) {
    Integer[] sorted = new Integer[unsorted.length];              
    sorted[0] = unsorted[0];                                      
    for (int i = 1; i < unsorted.length; i++) {
        for (int j = 0; j <= i; j++) {
            if (j==i || unsorted[i] < sorted[j]) {
                for (int k = i-1; k >= j; k--) {
                    sorted[k + 1] = sorted[k];
                }
                sorted[j] = unsorted[i];
                break;
            }
        }
    }
    return sorted;
}

2行：1
3行：1
4行：n
5行：从i=1到n-1，累加ti，
6行：从i=1到n-1，累加ti
7行：从i=1到n-1，累加 i-ti+1
8行：从i=1到n-1，累加 i-ti+1
10行：n-1
11 行：n-1

2，3，4 行执行次数很好理解。在第 5 行的 for 循环体中，如果找到了 unsorted[i] 的位置，并放置好后会跳出循环，但查找所用的次数是无法确定的，我们用ti表示。由于要从 i=1 执行到 i=n-1,所以第5，6行代码代码执行的次数为从i=1到n-1，累加ti。

再看 7，8 行。这段代码逻辑是将找到 unsorted[i] 插入位置及之后的元素往后移动一个位置。找到unsorted[i] 插入的位置我们用了 ti 次比较。插入位置为 ti-1。此时手中牌最后一张牌的位置为 i-1。那么需要移动的牌的数量为 i-1-(ti-1)+1，即为 i-ti+1。
在这里插入图片描述
由于数组下标从0，而不是1开始，所以会出现+1或-1，做成一些理解上的困难。其实你只要理解原理：移动的次数=当前手里牌的数量-(比较的次数-1)。

而且之前也提到过，时间复杂度其实只和高阶项有关系，所以这里只要不出现阶的误差就不会影响大局。

根据分析我们列出时间函数。
在这里插入图片描述
熊小猫：根据我们前面讲的内容，你来给出T(n)的渐进紧确界？

兔小白：这个简单，去掉常数项-2和低阶项4n，T(n)=O(n^2)。

熊小猫：可以啊，今晚扑克没白打！

兔小白：嗨，今晚光学习了，哪打扑克了。不过收获确实非常大！终于可以睡觉了！已经快12点了

熊小猫：别着急睡觉，你忘了还有经典的插入排序算法没有分析呢？

兔小白：让我来！我今天要看看凌晨四点半的北京！

熊小猫：你分析着，我先去睡觉了。明天还得上班呢。

public static Integer[] sortV2(Integer[] unsorted) {
    for (int i = 1; i < unsorted.length; i++) {
        for (int j = i; j > 0 && unsorted[j] < unsorted[j - 1]; j--) {
            Integer toBeSortedNumber = unsorted[j];
            unsorted[j] = unsorted[j - 1];
            unsorted[j - 1] = toBeSortedNumber;
        }
    }
    return unsorted;
}