A - 小C语言--词法分析程序

用数组存储需要在同一个地方用到的多个符号
思路:
1.获取每一行输入,并将每一行输入按照空格分割
2.将分割后的每一个部分进行判断
3.判断步骤:
1).定义临时变量 w ,用于存储在遍历到界符或特殊符号前的值
2).遍历到界符,或者运算符,若w不为空,则 w 的值一定为关键字或自定义标识或整数
3).运算符分为可能是两位和一位情况,分开讨论
4).遍历结束后还得验证 w 是否为空,因为可能存在 判断的额部分刚好是一个完整的 关键字或自定义标识或整数

# -*- coding: utf-8 -*-
"""
-------------------------------------------------
  File Name:    __init__.py
  Author:        lenovo
  Date:         2022/3/9
  Create by:     PyCharm
  Description :  C语言词法分析程序
-------------------------------------------------
"""

# 定义关键字
import sys

keyword = ["main", "if", "else", "for", "while", "int"]
boundary = ["{", "}", "(", ")", ",", ";"]
operator = ["+", "-", "*", "/"]  # 只有一位的运算符
operatorTwo = ["=", "!", "<", ">"]  # 可能为两位的运算符


# 判断 临时变量 w 是否为空,并输出
def print_w(w):
    if len(w) > 0:
        if w in keyword:
            print("(keyword,%s)" % w)
        elif w.isdigit():
            print("(integer,%s)" % w)
        else:
            print("(identifier,%s)" % w)


def judge(s):
    w = ""
    for i in range(len(s)):
        # 判断界符
        if s[i] in boundary:
            print_w(w)
            w = ""
            print("(boundary,%s)" % s[i])

        # 判断 两位 运算符
        elif s[i] in operatorTwo:
            print_w(w)
            w = ""
            # 判断当前位置后一位是否还有运算符
            # 有 则输出
            if (i + 1) < len(s) and s[i + 1] == "=":
                print("(operator,%s)" % (s[i] + "="))

            # 若当前位置判断后一位没有运算符,判断前一位,如果不存在,则输出当前运算符
            else:
                if i == 0:
                    print("(operator,%s)" % s[i])
                elif (i - 1) >= 0 and (s[i - 1] not in operatorTwo):
                    print("(operator,%s)" % s[i])

        # 判断 一位 运算符
        elif s[i] in operator:
            print_w(w)
            w = ""
            print("(operator,%s)" % s[i])

        else:
            w += s[i]

    # 没有特殊符号
    print_w(w)


if __name__ == '__main__':
    for line in sys.stdin:  # 当没有接受到输入结束信号就一直遍历每一行 ctrl+d结束输入
        # 去除连续的空格
        line = " ".join(line.split())
        # 分割
        words = line.split()
        for word in words:
            judge(word)

A - 小C语言–词法分析程序
Description
小C语言文法

  1. <程序>→<main关键字>(){<声明序列><语句序列>}

  2. <声明序列>→<声明序列><声明语句>|<声明语句>|<空>

  3. <声明语句>→<标识符表>;

  4. <标识符表>→<标识符>,<标识符表>|<标识符>

  5. <语句序列>→<语句序列><语句>|<语句>

  6. <语句>→< if语句>|< while语句>|< for语句>|<复合语句>|<赋值语句>

  7. < if语句>→< if关键字>(<表达式>)<复合语句>|(<表达式>)<复合语句>< else关键字><复合语句>

  8. < while语句>→< while关键字>(<表达式>)<复合语句>

  9. < for语句>→< for关键字>(<表达式>;<表达式>;<表达式>)<复合语句>

  10. <复合语句>→{<语句序列>}

  11. <赋值语句>→<表达式>;

  12. <表达式>→<标识符>=<算数表达式>|<布尔表达式>

  13. <布尔表达式>→<算数表达式> |<算数表达式><关系运算符><算数表达式>

  14. <关系运算符>→>|<|>=|<=|==|!=

  15. <算数表达式>→<算数表达式>+<项>|<算数表达式>-<项>|<项>

  16. <项>→<项>*<因子>|<项>/<因子>|<因子>

  17. <因子>→<标识符>|<无符号整数>|(<算数表达式>)

  18. <标识符>→<字母>|<标识符><字母>|<标识符><数字>

  19. <无符号整数>→<数字>|<无符号整数><数字>

  20. <字母>→a|b|…|z|A|B|…|Z

  21. <数字>→0|1|2|3|4|5|6|7|8|9

  22. < main关键字>→main

  23. < if关键字>→if

  24. < else关键字>→else

  25. < for关键字>→for

  26. < while关键字>→while

  27. < int关键字>→int

每行单词数不超过10个
小C语言文法如上,现在我们对小C语言写的一个源程序进行词法分析,分析出关键字、自定义标识符、整数、界符
和运算符。
关键字:main if else for while int
自定义标识符:除关键字外的标识符
整数:无符号整数
界符:{ } ( ) , ;
运算符:= + - * / < <= > >= == !=

Input
输入一个小C语言源程序,源程序长度不超过2000个字符,保证输入合法。

Output
按照源程序中单词出现顺序输出,输出二元组形式的单词串。

(单词种类,单词值)

单词一共5个种类:

关键字:用keyword表示
自定义标识符:用identifier表示
整数:用integer表示
界符:用boundary表示
运算符:用operator表示

每种单词值用该单词的符号串表示。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

心醉瑶瑾前

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值