中文教材讲二叉树的时候,一般给出了二叉树先\中\后序遍历的递归版本程序.然后不做任何解释的给出了先序遍历的非递归版本程序,然后告诉大家中序\后序遍历的非递归版本程序有点难,大家下去自己思考下.
先看给出的先序递归\非递归版本的代码:
void preorder(link h,void visit(link))
{
if(h==0) return;
visit(h);
preorder(h->l,visit);
preorder(h->r,visit);
}
void non_preorder(link h,void visit(link))
{
STACK<link> s(max);
s.push(h);
while(!s.empty())
{
visit(h=s.top()); s.pop();
if(h->r!=0) s.push(h-r);
if(h->l!=0) s.push(h-l);
}
}
仅仅看代码,确实很简单,但是非递归版本远远没有想象中的这么简单,只有完全弄明白了之后,才能很好的理解递归函数以及遍历的奥妙.
看了<algorithm in c++>后,被上面给出的讲解方式深深折服,觉得这样的教材才是真正的告诉你思考的过程,让你自己去体悟.
*在讨论之前,先记住一点,栈的作用是什么?------栈总是让优先级高的入栈,也就是说,应该把先处理的都入栈,该入栈的都入栈了之后,才从栈顶取出来处理.
由系统的栈实现的遍历(递归版本)和自己用栈实现的遍历(非递归版本)到底有什么区别?
递归版本的先序遍历程序流程和先序遍历的定义一致:
先访问根结点->然后访问其左子树->最后访问其右子树.而且系统的栈完整的,按顺序的保存了每一个遍历到的结点的指针,永远把传入当前函数的结点指针当成根结点来执行.
对于任意一个结点,在处理的过程中,只有在它的左右子树都完成了遍历之后,结点的指针才会出栈.(注意这里说的并不是遍历顺序,而说的是栈的机制,不会出现结点出栈了,再也找不到它的左右子树结点指针的情况)
非递归版本的先序遍历程序却不一样,第一步就是将根结点出栈,一旦根结点出栈了,我们就再也无法通过根结点去访问它的左右子树,所以必须在这个时刻就取出它的左右子树,先将右子树入栈,然后将左子树入栈,将他们的访问顺序固定.
为什么先序遍历的非递归版本程序比较简单,而中序和后序却要复杂?
如果把中序遍历的非递归版本程序也写成这样:
void non_preorder(link h,void visit(link))
{
STACK<link> s(max);
s.push(h);
while(!s.empty())
{
if(h->r!=0) s.push(h-r);
visit(h=s.top()); s.pop();
if(h->l!=0) s.push(h-l);
}
}
显然是不行的,因为根结点的访问顺序在这一轮循环中就被确定了,只考虑了左孩子,没有递归的考虑左子树.
假设我们实现了一种栈,栈中可以存放两种元素,一种是以结点为根结点的树,另一种只单纯的表示这个结点.
出栈的时候,如果是一颗树,那么先后将右子树,根结点,左子树入栈.
如果是一个结点,则直接遍历.
这样才是完全按照中序遍历的定义来的,每次遍历一个结点的时候,先递归的处理左子树,然后遍历自己,最后遍历右子树.和递归版本的函数还是有区别,两个函数的最终结果一样,即遍历结点的顺序一样,但是'发现'结点的顺序不一样,即入栈的先后不同,但是出栈的先后顺序是一样的.(自己想想细节)
现在我们用的栈可以存放两种元素,但是我们实际应用中使用的栈往往要求栈中所有元素都有相同的类型.
所有我们需要用一个标记数组来辅助栈,在逻辑上使得栈中元素可以有两种不同的类型.
这样才是分析问题,理解非递归版本代码的正确思路.
先序遍历之所以不需要区别出栈的元素类型是树还是结点,是因为根结点在此轮循环中就确定了遍历顺序,直接出栈就是了.
但如果把先序遍历非递归版本程序这种十分特殊的情况当成一般的思路来理解,反而会使得读者更加困惑.