一种语言的文法可以表示为一个四元组:G=<T,N,P,S>,其中T为终结符集合(用来表示词类),N为非终结符集合(用来表示语法成分),P为产生式(用来表示句法规则),S为起始符,它是N的一个元素。
自顶向下的分析是从树根开始推导的,它作用于如下形式的推导:S-->z1-->z2-->...-->zn,开始的时候,这个推导只包含起始符S,并且n=0。所用到的规则放在一个先进先出的堆栈里,开始时堆栈为空,这个堆栈的作用是记录最近所用到的规则。
优点:节约空间,自始至终只需要存储一棵树的结构
缺点:难以处理递归结构(若需要解决递归问题,则需要增加某种测试(陈小荷,2000))
算法如下:
(1)设zn中最左边的非终结符为B,用p(b,1)展开B。此时推导中早呢更加了一个元素,即n=n+1,将规则p(b,1)入栈
(2)设zn中最左边的非终结符的位置为i(如果zn中没有非终结符,则i=zn的长度+1),如果zn的前i-1个终结符跟输入