编译技术-词法分析

对循环语句和条件判断语句编写词法分析编译程序,只能通过一遍扫描完成。
实验要求:
(1) 关键字:
for if then else while do until int input output
所有关键字都是小写。
(2)运算符和分隔符:
: = + - * / < > <= <> >= ; ( ) #
(2) 其他标识符(ID)和整型常数(NUM),通过以下模式定义:
ID=letter(letter | digit)*
NUM=digit digit*
(4)空格由空白、制表符和换行符组成。空格一般用来分隔ID、NUM、运算符、分隔符和关键字,词法分析阶段通常被忽略。

词法分析程序的功能
输入:源程序
输出:二元组(词法记号,属性值/其在符号表中的位置)构成的序列。
例如:对源程序
int x:=5; if (x>0) then x:=2*x+1/3; else x:=2/x; #
经词法分析后输出如下序列:
(30, int)(10,’x’)(18, :=) (11,5) (26, ;) (2, if ) (27,( )……

keyword = ["for","if","then","else","while","do","until","int","input","output"]
def getkey(temp):
    key = -1
    assert isinstance(temp,str)
    if temp == "for" : key = 1
    elif temp == "if" : key = 2
    elif temp == "then" : key = 3
    elif temp == "else" : key = 4
    elif temp == "while" : key = 5
    elif temp == "do" : key = 6
    elif temp == "until" : key = 29
    elif temp == "input" : key = 31
    elif temp == "int" : key = 30
    elif temp == "output" : key = 32
    elif temp == "alnum" : key = 10
    elif temp == "digit" : key = 11
    elif temp == "+" : key = 13
    elif temp == "-" : key = 14
    elif temp == "*" : key = 15
    elif temp == "/" : key = 16
    elif temp == ":" : key = 17
    elif temp == ":=" : key = 18
    elif temp == "<" : key = 20
    elif temp == "<>" : key = 21
    elif temp == "<=" : key = 22
    elif temp == ">" : key = 23
    elif temp == ">=" : key = 24
    elif temp == "=" : key = 25
    elif temp == ";" : key = 26
    elif temp == "(" : key = 27
    elif temp == ")" : key = 28
    elif temp == "#" : key = 0
    elif temp == "float" : key = 12
    elif temp.isdigit():key = 110
    elif temp.isalnum():key = 100
    else : key = -1
    return key

def iseasy(key):
    if key == 0 or key == 13 or key == 14 or key == 15 or key == 16 or key == 25  or key == 26 or key == 27 or key == 28:
        return True
    else:
        return False
l1 = []
l2 = []
def f(file_name):
    try:
        fp_read = open(file_name, 'r')
        while True:
            read = fp_read.readline()
            read = read.lower()
            if not read:
                break
            length = len(read)
            i = -1
            while i < length - 1:
                i += 1
                if getkey(read[i]) == -1:
                    continue
                elif iseasy(getkey(read[i])):
                    l1.append(read[i])
                    l2.append(getkey(read[i]))
                else:
                    if read[i] == ":":
                        i += 1
                        if read[i] == "=":
                            l1.append(":=")
                            l2.append(getkey(":="))
                        else:
                            i -= 1
                            l1.append(":")
                            l2.append(getkey(":"))
                    elif read[i] == "<":
                        i += 1
                        if read[i] == ">":
                            l1.append("<>")
                            l2.append(getkey("<>"))
                        elif read[i] == "=":
                            l1.append("<=")
                            l2.append(getkey("<="))
                        else:
                            i -= 1
                            l1.append("<")
                            l2.append(getkey("<"))
                    elif read[i] == ">":
                        i += 1
                        if read[i] == "=":
                            l1.append(">=")
                            l2.append(getkey(">="))
                        else:
                            i -= 1
                            l1.append(">")
                            l2.append(getkey(">"))
                    elif read[i].isdigit():
                        flag = False
                        floatflag = False
                        s = str(read[i])
                        while True:
                            i += 1
                            if read[i].isdigit():
                                s = str(s) + str(read[i])
                            elif read[i].isalpha() and floatflag == False:
                                s = str(s) + str(read[i])
                                flag = True
                            elif read[i] == "." and floatflag == False and flag == False:
                                s = str(s) + str(read[i])
                                floatflag = True
                            else:
                                break
                        i -= 1
                        if flag:
                            l1.append(s)
                            l2.append(getkey("alnum"))
                        elif floatflag:
                            l1.append(s)
                            l2.append(getkey("float"))
                        else:
                            l1.append(s)
                            l2.append(getkey("digit"))
                    elif read[i].isalpha():
                        s = str(read[i])
                        while True:
                            i += 1
                            if read[i].isalnum():
                                s = str(s) + str(read[i])
                            else:
                                break
                        i -= 1
                        if s in keyword:
                            l1.append(s)
                            l2.append(getkey(s))
                        else:
                            l1.append("'"+s+"'")
                            l2.append(getkey("alnum"))
    except Exception:
        print(file_name, ': This FileName Not Found!')
def main():
    f("C:\\Users\\Qzh_794\\PycharmProjects\\hello\\1.txt")
    l1.reverse()
    l2.reverse()
    while l1 and l2:
        print("("+str(l2.pop())+","+str(l1.pop())+")")
if __name__ == '__main__':
    main()
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
大连理工大学软件学院编译技术课程——词法分析上机实验 实验目的:对循环语句和条件判断语句编写词法分析编译程序,只能通过一遍扫描完成。(用c++实现) 实验要求: (1) 关键字: for if then else while do 所有关键字都是小写。 (2)运算符分隔符: : = + - * / <= >= ; ( ) # (3)其他标识符(ID)和整型常数(NUM),通过以下正规式定义: ID=letter(letter | digit)* NUM=digit digit* (4)空格由空白、制表符和换行符组成。空格一般用来分隔ID、NUM、运算符分隔符和关键字词法分析阶段通常被忽略。 各种词法单元对应的词法记号如下: 词法单元 词法记号 词法单元 词法记号 for 1 : 17 if 2 := 18 then 3 < 20 else 4 21 while 5 23 letter(letter+digit)* 10 >= 24 digit digit* 11 = 25 + 13 ; 26 - 14 ( 27 * 15 ) 28 / 16 # 0 词法分析程序的功能 输入:源程序 输出:二元组(词法记号,属性值/其在符号表中的位置)构成的序列。 例如:对源程序 x:=5; if (x>0) then x:=2*x+1/3; else x:=2/x; # 经词法分析后输出如下序列: (10,’x’)(18, :=) (11,5) (26, ;) (2, if ) (27,( )…… 1.几点说明: (1)关键字表的初值。 关键字作为特殊标识符处理,把它们预先安排在一张表格中(称为关键字表),当扫描程序识别出标识符,查关键字表。如能查到匹配的单词,则该单词的关键字,否则为一般标识符。关键表为一个字符串数组,其描述如下: char *keyword[6]={”for”, ”if”, ”then” ,”else”,”while”, ”do” }; (2) 程序中需要用到的主要变量为 token , id和num. 1)id用来存放构成词法单元的字符串; 2)num用来存放整数(可以扩展到浮点数和科学计数法表示); 3)token用来存放词法单元的词法记号。 可以参考下面的代码: do{ lexical(); //将词法单元对应的记号保存到token中,属性值保存到num或者id中 switch(token) { case 11: printf ("(token, %d\n) ", num); break; case -1: printf("error!\n");break; default: printf("(%d,%s)\n", token, id); } }while (token!=0);

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值