大话数据结构读书笔记系列(四)栈与队列

4.1 开场白

同学们,大家好!我们又见面了。

不知道大家有没有玩过手枪,估计都没有。现在和平年代,上哪去玩这种危险的真东西,就是仿真玩具也大都被限制了。我小时候在军训时,也算是一次机会,几个老兵和我们学生聊天,让我们学习了一下关于枪的知识。

当时那个老兵告诉我们,早先军官们都爱用左轮手枪,而非弹夹式手枪,问我们为什么,我们谁也说不上来。现在我要问问你们,知道为什么吗?(下面一脸惘然)。

哈,我听到下面有同学说是因为左轮手枪好看,酷呀。嘿,当然不是这个原因。算了,估计你们也很难猜得到。他那时告诉我们说,因为子弹质量不过关,有个别可能是臭弹--也就是有问题的、打不出来的子弹。弹夹式手枪(如图4-1-1所示),如果当中有一颗是卡住了的臭弹,那么后面的子弹就都打不了了。想想看,在你准备用枪的时候,那基本到了不是你死就是我亡的时刻,突然这手枪明明有子弹却打不出来,这不是要命吗?而左轮手枪就不存在这问题,这一颗不行,转到下一颗就可以了,人总不会倒霉到六颗全是臭弹。当然,后来子弹质量基本过关了,由于弹夹可以放8颗甚至20颗子弹,比左轮手枪的只能放6颗子弹要多,所以后来普及率更高的还是弹夹式的手枪。

哦,原来如此。我当时自认为聪明的说道:那很好办呀,这弹夹不是先放进去的子弹的,最后才可以打出来吗?你可以把臭弹最先放进去,好子弹留在后面,这样就不会影响了呀。

他笑骂道,笨蛋,如果真的知道哪一颗是臭弹,还放进去干嘛,早就扔了。(大家大笑)

哎,我其实一直都是有点笨笨的。

4.2 栈的定义

4.2.1 栈的定义

好了,说这个例子目的不是要告诉你们我当年有多笨,而是为了引出今天的主题,就是类似弹夹中的子弹一样先进去,却要后出来,而后进的,反而可以先出来的数据结构--栈。

在我们软件应用中,栈这种后进先出数据结构的应用是非常普遍的比如你用浏览器上网时,不管什么浏览器都有一个"后退"键,你点击后可以按访问顺序的逆序加载浏览过的网页。比如你本来看着新闻好好的,突然看到一个链接说,有个可以让你年薪100万的工作,你毫不犹豫点击它,跳转进去一看,这都是啥呀,具体内容我也就不说了,骗人骗得一点水平都没有。此时你还想回去继续看新闻,就可以点击左上角的后退键。即使你从一个网页开始,连续点了几十个链接跳转,你点"后退"时,还是可以像历史倒退一样。回到之前浏览过的某个页面,如图4-2-1所示。

很多类似的软件,比如Word、Photoshop等文档或图像编辑软件中,都有撤销(undo)的操作,也是用栈这种方式来实现的,当然不同的软件具体实现代码会有很大差异,不过原理其实都是一样的。

我们把允许插入和删除的一端称为栈顶(top),另一端称为栈底(bottom),不含任何数据元素的栈称为空栈。栈又称为后进先出(Last In First Out)的线性表,简称LIFO结构

理解栈的定义需要注意:

首先它是一个线性表,也就是说,栈元素具有线性关系,即前驱后继关系。只不过它是一种特殊的线性表而已。定义中说是在线性表的表尾进行插入和删除操作,这里表尾是指栈顶,而不是栈底。

它的特殊之处就在于限制了这个线性表的插入和删除位置,它始终只在栈顶进行。这也就使得:栈底是固定的,最先进栈的只能在栈底。

栈的插入操作,叫作进栈,也叫压栈、入栈。类似子弹入弹夹,如图4.2.2所示。

栈的删除操作,叫作出栈,也有的叫作弹栈。如同弹夹中的子弹出夹,如图4-2-3所示。

进栈出栈变化形式

现在我要问问大家,这个最先进栈的元素,是不是就只能是最后出栈呢

答案是不一定,要看什么情况。栈对线性表的插入和删除的位置进行了限制,并没有对元素进出的时间进行限制,也就是说,在不是所有元素都进栈的情况下,事先进去的元素也可以出栈,只要保证是栈顶元素出栈就可以了。

举例来说,如果我们现在是有3个整型数字元素1、2、3依次出栈,会有哪些出栈次序呢?

  • 第一种:1、2、3进,再3、2、1出。这是最简单的最好理解的一种,出栈次序为321。
  • 第二种:1进,1出,2进,2出,3进,3出。也就是进一个就出一个,出栈次序为123。
  • 第三种:1进,2进,2出,1出,3进,3出。出栈次序为213。
  • 第四种:1进,1出,2进,3进,3出,2出。出栈次序为132。
  • 第五种:1进,2进,2出,3进,3出,1出。出栈次序为231。

有没有可能是312这种次序出栈呢?答案是肯定不会。因为3先出栈,就意味着,3曾经进栈,既然3都进栈了,那也就意味着,1和2已经进栈了,此时,2一定是在1的上面,就是更接近栈顶,那么出栈只可能是321,不然不满足123一次进栈的要求,所以此时不会发生1比2先出栈的情况。

从这个简单的例子就能看出,只是3个元素,就有5种可能的出栈次序,如果元素数量多,其实出栈的变化将会更多的。这个知识点一定要弄明白。

4.3 栈的抽象数据类型

对于栈来讲,理论上线性表的操作特性它都具备,可由于它的特殊性,所以针对它在操作上会有些变化。特别是插入和删除操作,我们改名为push和pop,英文直译的话是压和弹,更容易理解。你就把它当成是弹夹的子弹压入和弹出就好记忆了,我们一般叫进栈和出栈由于栈本身就是一个线性表,那么上一章我们讨论了线性表的顺序存储和链式存储,对于栈来说,也是同样适用的

4.4 栈的顺序存储结构及实现

4.4.1 栈的顺序存储结构

既然栈是线性表的特例,那么栈的顺序存储其实也是线性表顺序存储的简化,我们简称为顺序栈。线性表是用数组来实现的,想想看,对于栈这种只能一头插入删除的线性表来说,用数组哪一端来作为栈顶和栈底比较好?

对,没错,下标为0的一端作为栈底比较好,因为首元素都存在栈底,变化最小,所以让它作栈底。

我们定义一个top变量来指示栈顶元素在数组中的位置,这top就如同中学物理学过的游标卡尺的游标,如图4-4-1,它可以来回移动,意味着栈顶的top可以变大变小,但无论如何游标不能超出尺的长度。同理,若存储栈的长度为StackSize,则栈顶位置top必须小于StackSize。当栈存在一个元素时,top等于0,因此通常把空栈的判定条件定为top等于-1。

来看栈的结构定义

若现在有一个栈,StackSize是5,则栈普通情况、空栈和栈满的情况示意图如图4-4-2所示。

4.4.2 栈的顺序存储结构--进栈操作

对于栈的插入,即进栈操作,其实就是做了如图4-4-3所示的处理。

因此对于进栈操作push,其代码如下:

4.4.3 栈的顺序存储结构--出栈操作

出栈操作pop,代码如下: 两者没有涉及到任何循环语句,因此时间复杂度均是O(1)。

4.5 两栈共享空间

其实栈的顺序存储还是很方便的,因为它只准栈顶进出元素,所以不存在线性表插入和删除时需要移动元素的问题。不过它有一个很大的缺陷,就是必须事先确定数组存储空间大小,万一不够用了,就需要编程手段来扩展数组的容量,非常麻烦。对于一个栈,我们也只能尽量考虑周全,设计出合适大小的数组来处理,但对于两个相同类型的栈,我们却可以做到最大限度地利用其事先开辟的存储空间来进行操作。

打个比方,两个大学室友毕业同时到北京工作,开始时,他们觉得住了这么多年学校的集体宿舍,现在工作了一定要有自己的私密空间。于是他们都希望租房时能找到独住的一居室,可找来找去却发现,最便宜的一居室也要每月1500元,地段还不好,实在是承受不起,最终他俩还是合租了一套两居室,一共2000元,各出一半,还不错。

对于两个一居室,都有独立的卫生间和厨房,是私密了,但大部分空间的利用率却不高。而两居室,两个人各有卧室,还共享了客厅、厨房和卫生间,房价的利用率就显著提高,而且租房成本也大大下降了

同样的道理,如果我们有两个相同类型的栈,我们为它们各自开辟了数组空间,极有可能是第一个栈已经满了,再进栈就溢出了,而另一个栈还有很多存储空间空闲。这又何必呢?我们完全可以用一个数组来存储两个栈,只不过需要点小技巧。

我们的做法如图4-5-1,数组有两个端点,两个栈又两个栈底,让一个栈的栈底为数组的始端,即下标为0处,另一个栈为栈的末端,即下标为数组长度n-1处。这样,两个栈如果增加元素,就是两端点向中间延伸。

其实关键思路是:它们是在数组的两端,向中间靠拢。top1和top2是栈1和栈2的栈顶指针,可以想象,只要它们不见面,两个栈就可以一直使用。

想想极端的情况,若栈2是空栈,栈1的top1等于n-1时,就是栈1满了。反之,当栈1为空栈时,top等于0时,为栈2满。单更多的情况,其实就是我刚才说的,两个栈见面之时,也就是两个指针之间相差1时,即top1+1 == top2为栈满。

两栈共享空间的结构的代码如下:

对于两栈共享空间的push方法,我们除了要插入元素值参数外,还需要有一个判断是栈1还是栈2的栈号参数stackNumber。插入元素的代码如下:

因为在开始已经判断了是否有栈满的情况,所以后面的top1+1或top2-1是不担心溢出问题的。

对于两栈共享空间的pop方法,参数就只是判断栈1 栈2的参数stackNumber,代码如下:

事实上,使用这样的数据结构,通常都是当两个栈的空间需求有相反关系时,也就是一个栈增长时另一个栈在缩短的情况。就像买卖股票一样,你买入时,一定是有一个你不知道的人在做卖出操作。有人赚钱,就一定是有人赔钱。这样使用两栈共享空间存储方法才有比较大的意义。否则两个栈都在不停地增长,那很快就会因栈满而溢出了

当然,这只是针对两个具有相同数据类型的栈的一个设计上的技巧,如果是不相同数据类型的栈,这种办法不但不能更好地处理问题,反而会使问题变得更加复杂,大家要注意这个前提。

4.6 栈的链式存储结构及实现

4.6.1 栈的链式存储结构

讲完了栈的顺序存储结构,我们现在来看看栈的链式存储结构,简称为链栈

想想看,栈只是栈顶来做插入和删除操作,栈顶放在链表的头部还是尾部呢?由于单链表有头指针,而栈顶指针也是必须的,那干嘛不让它俩合二为一呢,所以比较好的办法是把栈顶放在单链表的头部(如图4-6-1所示)。另外,都已经有了栈顶在头部了,单链表中比较常用的头结点也就失去了意义,通常对于链栈来说,是不需要头结点的。

对于链栈来说,基本不存在栈满的情况,除非内存已经没有可以使用的空间,如果真的发生,那此时的计算机操作系统已经面临死机奔溃的情况,而不是这个链栈是否溢出的问题

但对于空栈来说,链表原定义是头指针指向空,那么链栈的空其实就是top=NULL的时候。

链栈的结构代码如下: 链栈的操作绝大部分都和单链表类似,只是在插入和删除上,特殊一些

4.6.2 栈的链式存储结构--进栈操作

对于链栈的进栈push操作,假设元素值为e的新结点是s,top为栈顶指针,示意图如图4-6-2所示代码如下。

4.6.3 栈的链式存储结构--出栈操作 至于链栈的出栈pop操作,也是很简单的三句操作。假设变量p用来存储要删除的栈顶结点,将栈顶指针下移一位,最后释放p即可,如图4-6-3所示。

链栈的进栈的push和出栈pop操作都很简单,没有任何循环操作,时间复杂度均为O(1)

对比一下顺序栈与链栈,它们在时间复杂度上是一样的,均为O(1)。对于空间性能,顺序栈需要事先确定一个固定的长度,可能会存在内存空间浪费的问题,但它的优势是存取时定位很方便,而链栈则要求每个元素都有指针域,这同时也增加了一些内存开销,但对于栈的长度无限制。所以他们的区别和线性表中讨论的一样,如果栈的使用过程中元素变化不可预料,有时候很小,有时候非常大,那么最好是用链栈,反之,如果它的变化在可控范围内,建议使用顺序栈会更好一些

4.7 栈的作用

有的同学可能会觉得,用数组或链表直接实现功能不就行了吗?干嘛要引入栈这样的数据结构呢?这个问题问得好。

其实这和我们明明有两只脚可以走路,干嘛还要乘汽车、火车、飞机一样。理论上,陆地上的任何地方,你都是可以靠双脚走到的,可那需要多少时间和精力呢?我们更关注的是到达而不是如何去的过程。

栈的引入简化了程序设计的问题,划分了不同关注层次,使得思考范围缩小,更加聚焦于我们要解决的问题核心。反之,像数组等,因为要分散精力去考虑数组的下标增减等细节问题,反而掩盖了问题的本质

所以现在的许多高级语言,比如Java、C#等都有对栈结构的封装,你可以不用关注它的实现细节,就可以直接使用Stack的push和pop方法,非常方便。

4.8 栈的应用--递归

栈有一个很重要的应用:在程序设计语言中实现了递归。那么什么是递归呢?

当你往镜子前面一站,镜子里面就有一个你的像。但你试过两面镜子一起照吗?如果A、B两面镜子相互面对面放着,你往中间一站,嘿,两面镜子里都有你的千百个"化身"。为什么会有这么奇妙的现象呢?原来,A镜子里有B镜子的像,B镜子里也有A镜子的像,这样反反复复,就会产生一连串的"像中像"。这是一种递归现象,如图4-8-1所示。

我们先来看一个经典的递归例子:斐波那契数列(Fibonacci)。为了说明这个数列,这位斐老还举了一个很形象的例子。

4.8.1 斐波那契数列实现

如果兔子在出生两个月后,就有繁殖能力,一对兔子每个月能生出一对小兔子来。假设所有兔都不死,那么一年以后可以繁殖多少对兔子呢?

我们拿新出生的一对小兔子分析一下:第一个月小兔子没有繁殖能力,所以还是一对;两个月后,生下一对小兔子数共有两对;三个月以后,老兔子又生下一对,因为小兔子还没有繁殖能力,所以一共是三对...依次类推可以列出下表(表4-8-1)。

表中 数字1,1,2,3,5,8,13...构成了一个序列。这个数列有个十分明显的特点,那是:前面相邻两项之和,构成了后一项,如图4-8-2所示。

可以发现,编号1的一对兔子经过六个月就变成8对兔子了。如果我们用数学函数来定义就是:

先考虑一下,如果我们要实现这样的数列用常规的迭代的办法如何实现?假设我们需要打印出前40位的斐波那契数列数。代码如下:

代码很简单,几乎不用做什么解释。但其实我们的代码,如果用递归来实现,还可以更简单。 怎么样,相比较迭代的代码,是不是干净很多。嘿嘿,不过要弄懂它得费点脑子。

函数怎么可以自己调用自己?听起来有些难以理解,不过你可以不要把一个递归函数中调用自己的函数看作是在调用自己,而就当它是在调用另一个函数。只不过,这个函数和自己长得一样而已。

我们来模拟代码中的Fbi(i)函数当i=5的执行过程,如图4-8-3所示。

4.8.2 递归定义

在高级语言中,调用自己和其他函数并没有本质的不同。我们把一个直接调用自己或通过一系列的调用语句间接地调用自己的函数,称做递归函数

当然,写递归程序最怕的就是陷入永不结束的无穷递归中,所以,每个递归定义必须至少有一个条件,满足时递归不再进行,即不再引用自身而是返回值退出

比如刚才的例子,总有一次递归会使得i小于2的,这样就可以执行return i的语句而不用继续递归了。

对比了两种实现斐波那契的代码。迭代何递归的区别是:迭代使用的是循环结构,递归使用的是选择结构。递归能使程序的结构更清晰、更简洁、更容易让人理解,从而减少读懂代码的时间。但是大量的递归调用会建立函数的副本,会耗费大量的时间和内存。迭代则不需要反复调用函数和占用额外的内存。因此我们应该视不同情况选择不同的代码实现方式。

那么我们讲了这么多递归的内容,和栈有什么关系呢?这得从计算机系统的内部说起。

前面我们已经看到递归是如何执行它的前行和退回阶段的。递归过程退回的顺序是它前行顺序的逆序。在退回过程中,可能要执行某些动作,包括恢复在前行过程中存储起来的某些数据。

这种存储某些数据,并在后面又以存储的逆序恢复这些数据,以提供之后使用的需求,显然很符合栈这样的数据结构,因此,编译器使用栈实现递归就没什么好惊讶的了。

简单的说,就是在前行阶段,对于每一层递归,函数的局部变量、参数值以及返回地址都被压入栈中。在退回阶段,位于栈顶的局部变量、参数值和返回地址被弹出,用于返回调用层次中执行代码的其余部分,也就是恢复了调用的状态。

当然,对于现在的高级语言,这样的递归问题是不需要用户来管理这个栈的,一切都由系统代劳了。

4.9 栈的应用--四则运算表达式求值

4.9.1 后缀(逆波兰)表示法定义

栈的现实应用也很多,我们再来重点讲一个比较常见的应用:数学表达式的求值。

我们小学学数学的时候,有一句话是老师反复强调的,"先乘除,后加减,从左算到右,先括号内后括号外"。这个大家都不陌生。我记得我小时候,天天做这种加减乘除的数学作业,很烦,于是就偷偷拿了老爸的计算器来帮着算答案,对于单纯的两个数的加减乘除,的确是省心不少,我也因此潇洒了一两年。可后来要求要加减乘除,甚至还有带有大中小括号的四则运算,我发现老爸那个简陋的计算器不好使了,比如9+(3-1)*3+10/2,这是一个非常简单的题目,心算也可以很快算出是20.可就这么简单的题目,计算器却不能在一次输入后马上得出结果,很是不方便。

当然,后来出的计算器就高级多了,它引入了四则运算表达式的概念,也可以输入括号了,所以现在的00后的小朋友们,更加可以偷懒、抄近路做数学作业了。

那么在新式计算器中或者计算机中,它是如何实现的呢?如果让你用C语言或者其他高级语言实现对数学表达式的求值,你打算如何做?

这里面的困难就在于乘除在加减的后面,却要先运算,而加入了括号后,就变得更加复杂。不知道该如何处理。

但仔细观察后发现,括号都是成对出现的,有左括号就一定会有右括号,对于多重括号,最终也是完全嵌套匹配的。这用栈结构正好合适,只要碰到左括号,就将次左括号进栈,不管表达式有多少重括号,反正遇到左括号就进栈,而后面出现右括号时,就让栈顶的左括号出栈,期间让数字运算。这样,最终有括号的表达式从左到右巡查一遍,栈应该是由空到有元素,最终再因全部匹配成功后成为空栈的结果。

但对于四则运算,括号也只是当中的一部分,先乘除后加减使得问题依然复杂,如何有效地处理它们呢?我们伟大的科学家想到了好办法。

20世纪50年代,波兰逻辑学家Jan Lukasiewicz,当时也和我们现在的同学们一样,困惑与如何才可以搞定这个四则运算,不知道他是否也像牛顿被苹果砸到头而想到万有引力的原理,或者还是阿基米德在浴缸中洗澡时想到判断皇冠是否纯金的办法,总之他也是灵感突现,想到了一种不需要括号的后缀表达法,我们也把它称为逆波兰(Reverse Polish Notation,RPN)表示。我想可能是他的名字太复杂了,所以后人只用他的国籍而不是姓名来命名,实在可惜。这也告诉我们,想要流芳百世,名字还要起得朗朗上口才行。这种后缀表示法,是表达式的一种新的显示方式,非常巧妙地解决了程序实现四则运算的难题。

我们先来看看,对于"9+(3-1)3+10/2",如果要用后缀表示法应该是什么样子:"9 3 1-3 +10 2/+",这样的表达式称为后缀表达式,叫后缀的原因在于所有的符号都是在要运算数字的后面出现。显然,这里没有了括号。对于从来没有接触过后缀表达式的同学来讲,这样的表述是很难受的。不过你不喜欢,有机器喜欢,比如我们聪明的计算机。

4.9.2 后缀表达式计算结果

为了解释后缀表达式的好处,我们先来看看,计算机如何应用后缀表达式计算出最终的结果20的。

后缀表达式: 9 3 1-3 * + 10 2 /+

规则:从左到右遍历表达式的每个数字和符号,遇到是数字就进栈,遇到是符号,就将处于栈顶两个数字出栈,进行运算,运算结果进栈,一直到最终获得结果。

  1. 初始化一个空栈。此栈用来对要运算的数字进出使用。如图4-9-1的左图所示。
  2. 后缀表达式中前三个都是数字,所以9、3、1进栈,如图4-9-1的右图所示。
  3. 接下来是"-",所以将栈中的1出栈作为减数,3出栈作为被减数,并运算3-1得到2,再将2进栈,如图4-9-2的左图所示。
  4. 接着是数字3进栈,如图4-9-2的右图所示。
  5. 后面是"*",也就意味着栈中3和2出栈,2与3相乘,得到6,并将6进栈,如图4-9-3的左图所示。
  6. 下面是"+",所以栈中6和9出栈,9与6相加,得到15,将15进栈,如图4-9-3的右图所示。
  7. 接着是10与2两数字进栈,如图4-9-4的左图所示。
  8. 接下来是符号"/",因此,栈顶的2与10出栈,10与2相除,得到5,将5进栈,如图4-9-4的右图所示。
  9. 最后一个是符号"+",所以15与5出栈并相加,得到20,将20出栈,如图4-9-5的左图所示。
  10. 结果是20出栈,栈变为空,如图4-9-5的右图所示。

果然,后缀表达法可以很顺利解决计算的问题。现在除了睡觉的同学,应该都有同样的疑问,就是这个后缀表达式"9 3 1-3 * + 10 2 /+"是怎么出来的?这个问题不搞清楚,等于没有解决。所以下面,我们就来推导如何让"9+(3-1)x3+10/2"转化为"9 3 1-3* + 10 2 /+"。

4.9.3 中缀表达式转后缀表达式

我们把平时所用的标准四则运算表达式,即"9+(3-1)x3+10/2"叫做中缀表达式。因为所有的运算符号都在两数字的中间,现在我们的问题就是中缀到后缀的转化。

中缀表达式"9+(3-1)x3+10/2"转化为后缀表达式"9 3 1-3* + 10 2 /+"。

规则:从左到右遍历中缀表达式的每个数字和符号,若是数字就输出,即成为后缀表达式的一部分;若是符号,则判断其与栈顶符号的优先级,是右括号或优先级低于栈顶符号(乘除优先加减)则栈顶元素依次出栈并输出,并将当前符号进栈,一直到最终输出后缀表达式为止。

  1. 初始化一空栈,用来对符号进出栈使用。如图4-9-6的左图所示。
  2. 第一个字符是数字9,输出9,后面是符号"+",进栈。如图4-9-6的右图所示。
  3. 第三个字符是"(",依然是符号,因其只是左括号,还未配对,故出栈。如图4-9-7的左图所示。
  4. 第四个字符是数字3,输出,总表达式为9 3,接着是"-",进栈。如图4-9-7的右图所示。
  5. 接下来是数字1,输出,总表达式为9 3 1,后面是符号")",此时,我们需要去匹配此前的"(",所以栈顶依次出栈,并输出,直到"("出栈为止。此时左括号上方只有"-",因此输出"-"。总的输出表达式为9 3 1 -。如图4-9-8的左图所示。
  6. 接着是数字3,输出,总的表达式为9 3 1 - 3。紧接着是符号"X",因为此时的栈顶符号为"+"号,优先级低于"X",因此不输出,"*"进栈。如图4-9-8的右图所示。
  7. 之后是符号"+",此时当前栈顶元素"*"比这个"+"的优先级高,因此栈中元素出栈并输出(没有比"+"号更低的优先级,所以全部出栈),总输出表达式为9 3 1-3 * +。然后将当前这个符号"+"进栈。也就是说,前6张图的栈底的"+"是指中缀表达式中开头的9后面那个"+",而图4-9-9左图中的栈底(也是栈顶)的"+"是指"9+(3-1)x3+"中的最后一个"+"。
  8. 紧接着数字10,输出,总表达式变为9 3 1-3 * + 10。后是符号"/",所以"/"进栈。如图4-9-9的右图所示。
  9. 最后一个数字2,输出,总的表达式为9 3 1 - 3 * + 10 2。如图4-9-10的左图所示。
  10. 因已经到最后,所以将栈中符号全部出栈并输出。最终输出的后缀表达式结果为9 3 1 - 3 * + 10 2 /+。如图4-9-10的右图所示。

从刚才的推导中你会发现,要想让计算机具有处理我们通常的标准(中缀)表达式的能力,最重要的就是两步:

  1. 将中缀表达式转化为后缀表达是吧(栈用来进出运算的符号)。
  2. 将后缀表达式进行运算得出结果(栈用来进出运算的数字)。

整个过程,都充分利用了栈的后进先出特性来处理,理解好它其实也就理解好了栈这个数据结构。

好了,休息一下,一会儿我们继续,接下来会讲队列。

4.10 队列的定义

你们在用用电脑时有没有经历过,机器有时会处于疑似死机的状态,鼠标点什么似乎都没用,双击任何快捷方式都不动弹。就当你失去耐心,打算reset时。突然它像酒醒了一样,把你刚才点击的所有操作全部都按顺序执行了一遍。这其实是因为操作系统中的多个程序因需要通过一个通道输出,而按先后次序排队等待造成的。

再比如像移动、联通、电信等客服电话,客服人员与客户相比总是少数,在所有的客服人员都占线的情况下,客户会被要求等待,直到有某个客服人员空下来,才能让最先等待的客户接通电话。这里也是将所有当前拨打客服电话的客户进行了排队处理。

操作系统和客服系统中,都是应用了一种数据结构来实现刚才提到的先进先出的排队功能,这就是队列

队列是一种先进先出(First In First Out)的线性表,简称FIFO。允许插入的一端称为队尾,允许删除的一端称为队头。假设队列是q=(a1,a2,....,an),那么a1就是队头元素,而an是队尾元素。这样我们就可以删除时,总是从a1开始,而插入时,列在最后。这也比较符合我们通常生活中的习惯,排在第一个的优先出列,最后来的当然排在队伍最后,如图4-10-1所示。 队列在程序设计中用得非常频繁。前面我们已经举了两个例子,再比如用键盘进行各种字母或数字的输入,到显示器上如记事本软件上的输出,其实就是队列的典型应用,假如你本来和女友聊天,想表达你是我的上帝,输入god,而屏幕上却显示出了dog发了出去,这真是要气死人了。

4.11 队列的抽象数据类型

同样是线性表,队列也有类似线性表的各种操作,不同的就是插入数据只能在队尾进行,删除数据只能在队头进行。

4.12 循环队列

线性表有顺序存储和链式存储,栈是线性表,所以有着两种存储方式。同样,队列作为一种特殊的线性表,也同样存在这两种存储方式。我们先来看队列的顺序存储结构。

4.12.1 队列顺序存储的不足

我们假设一个队列有n个元素,则顺序存储的队列需建立一个大于n的数组,并把队列的所有元素存储在数组的前n个单元,数组下标为0的一端即是队头。所谓的入队列操作,其实就是在队尾追加一个元素,不需要移动任何元素,因此时间复杂度为O(1),如图4-12-1所示。

与栈不同的是,队列元素的出列是在队头,即下标为0的位置,那也就意味着,队列中的所有元素都得向前移动,以保证队列的队头,也就是下标为0的位置不为空,此时时间复杂度为O(n),如图4-12-2所示。 这里的实现和线性表的顺序存储结构完全相同,不再详述。

在现实中也是如此,一群人在排队买票,前面的人买好了离开,后面的人就要全部向前一步,补上空位,似乎这也没什么不好。

可有时想想,为什么出队列时一定要全部移动呢,如果不去限制队列的元素必须存储在数组的前n个单元这一条件,出队的性能就会大大增加。也就是说,队头不需要一定在下标为0的位置,如图4-12-3所示。

为了避免当只有一个元素时,队头和队尾重合使处理变得麻烦,所以引入两个指针,front指针指向队头元素,rear指针指向队尾元素的下一个位置,这样当front等于rear时,此队列不是还剩一个元素,而是空队列。

假设是长度为5的数组,初始状态,空队列如图4-12-4的左图所示,front与rear指针均指向下标为0的位置。然后入队a1、a2、a3、a4,front指针依然指向下标为0的位置,而rear指针指向下标为4的位置,如图4-12-4的右图所示。

出队a1、a2,则front指针指向下标为2的位置,rear不变,如图4-12-5的左图所示,再入队a5,此时front指针不变,rear指针移动到数组之外。嗯?数组之外,那将是哪里?如图4-12-5的右图所示。

问题还不止于此。假设这个队列的总个数不超过5个,但目前如果接着入队的话,因数组末尾元素已经占用,再向后加,就会产生数组越界的错误,可实际上,我们的队列在下标为0和1的地方还是空闲的。我们把这种现象叫做"假溢出"。

现实当中,你上了公交车,发现前排有两个空座位,而后排所有座位都已经坐满,你会怎么做?立马下车,并对自己说,后面没座了,我等下一辆?

没有这么笨的人,前面有座位,当然也是可以坐的,除非坐满了,才会考虑下一辆。

4.12.2 循环队列定义

所以解决假溢出的办法就是后面满了,就再从头开始,也就是头尾相接的循环。我们把队列的这种头尾相接的顺序存储结构称为循环队列

刚才的例子继续,图4-12-5的rear可以改为指向下标为0的位置,这样就不会造成指针指向不明的问题了,如图4-12-6所示。

接着入队a6,将它放置于下标为0处,rear指针指向下标为1处,如图4-12-7的左图所示。若再入队a7,则rear指针就与front指针重合,同时指向下标为2的位置,如图4-12-7的右图所示。

  • 此时问题又出来了,我们刚才说,空队列时,front等于rear,现在当队列满时,也是front等于rear,那么如何判断此时的队列究竟是空还是满呢?
  • 办法一是设置一个标志变量flag,当front == rear,且flag=0 时为队列空,当front == rear,且flag=1时为队列满。
  • 办法二是当队列空时,条件就是 front = rear,当队列满时,我们修改其条件,保留一个元素空间。也就是说,队列满时,数组中还有一个空闲单元。例如图4-12-8所示,我们就认为此队列已经满了,也就是说,我们不允许图4-12-7的右图情况出现。

我们重点来讨论第二种方法,由于rear可能比front大,也可能比front小,所以尽管它们只相差一个位置时就是满的情况,但也可能是相差整整一圈。所以若队列的最大尺寸为QueueSize,那么队列满的条件是(rear+1)%QueueSize==front(取模"%"的目的就是为了整合rear与front大小为一个问题)。比如上面这个例子,QueueSize=5,图4-12-8的左图中front=0,而rear=4,(4+1)%5=0,所以此时队列满。再比如图4-12-8中的右图,front=2而rear=1.(1+1)%5=2,所以此时队列也是满的。而对于图4-12-6,front=2而rear=0,(0+1)%5=1,1!=2,所以此时队列并没有满。

另外,当rear>front时,即图4-12-4的右图和4-12-5的左图,此时队列的长度为rear-front。但当rear< front时,如图4-12-6和图4-12-7的左图,队列长度分为两段,一段是QueueSuze-front,另一段是0+rear,加在一起,队列长度为rear-front+QueueSize。因此通用的计算队列长度公式为:

有了这些讲解,现在实现循环队列的代码就不难了。

循环队列的顺序存储结构代码如下:

循环队列的初始化代码如下:

循环队列求队列长度代码如下:

循环队列的入队列操作代码如下:

循环队列的出队列操作代码如下:

从这一段讲解,大家应该发现,单是顺序存储,若不是循环队列,算法的时间性能是不高的,但循环队列又面临着数组可能会溢出的问题,所以我们还需要研究一下不需要担心队列长度的链式存储结构。

4.13 队列的链式存储结构及实现

队列的链式存储结构,其实就是线性表的单链表,只不过它只能尾进头出而已,我们把它简称为链队列。为了操作上的方便,我们将队头指针指向链队列的头结点,而队尾指针指向终端结点,如图4-13-1所示。

空队列时,front和rear都指向头结点,如图4-13-2所示。

链队列的结构为:

4.13.1 队列的链式存储结构--入队操作

入队操作时,其实就是在链表尾部插入结点,如图4-13-3所示。

其代码如下:

4.13.2 队列的链式存储结构--出队操作

出队操作时,就是头结点的后继结点出队,将头结点的后继改为它后面的节点,若链表除头结点外只剩一个元素时,则需将rear指向头结点,如图4-13-4所示。

代码如下:

对于循环队列与链队列的比较,可以从两方面来考虑,从时间上,其实它们的基本操作都是常数时间,即都为O(1)的,不过循环队列是事先申请好空间,使用期间不释放,而对于链队列,每次申请和释放结点也会存在一些时间开销,如果入队出队频繁,则两者还是有细微差异。对于空间上来说,循环队列必须有一个固定的长度,所以就有了存储元素个数和空间浪费的问题。而链队列不存在这个问题,尽管它需要一个指针域,会产生一些空间上的开销,但也可以接受。所以在空间上,链队列更加灵活

总的来说,在可以确定队列长度最大值的情况下,建议用循环队列,如果你无法预估队列的长度时,则用链队列

4.14 总结回顾

又到了总结回顾的时间。我们这一章讲的是栈和队列,它们都是特殊的线性表,只不过对插入和删除操作做了限制。

  • 栈(stack)是限定仅在表尾进行插入和删除操作的线性表。
  • 队列(queue)是只允许在一端进行插入操作,而在另一端进行删除操作的线性表。

它们均可以用线性表的顺序存储结构来实现,但都存在着顺序存储的一些弊端。因此它们各自有各自的技巧来解决这个问题。

  1. 对于栈来说,如果是两个相同数据类型的栈,则可以用数组的两端作栈底的方法来让两个栈共享数据,这就可以最大化地利用数组的空间
  2. 对于队列来说,为了避免数组插入和删除时需要移动数据,于是就引入了循环队列,使得队头和队尾可以在数组中循环变化。解决了移动数据的时间损耗,使得本来插入和删除是O(n)的时间复杂度变成了O(1)

它们也都可以通过链式存储结构来实现,实现原则上与线性表基本相同,如图4-14-1所示。

转载于:https://my.oschina.net/u/2484728/blog/1828351

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值