小C语言程序----词法分析程序输出单词

最新推荐文章于 2023-09-26 23:51:35 发布

爱敲代码的小赤佬

最新推荐文章于 2023-09-26 23:51:35 发布

阅读量1.3k

点赞数

分类专栏： os+编译原理

本文链接：https://blog.csdn.net/dongjian2/article/details/103264820

版权

os+编译原理专栏收录该内容

8 篇文章 0 订阅

订阅专栏

7-2 小C语言–词法分析程序 (30 分)
小C语言文法

<程序>→(){<声明序列><语句序列>}
<声明序列>→<声明序列><声明语句>|<声明语句>|<空>
<声明语句>→<标识符表>;
<标识符表>→<标识符>,<标识符表>|<标识符>
<语句序列>→<语句序列><语句>|<语句>
<语句>→< if语句>|< while语句>|< for语句>|<复合语句>|<赋值语句>
< if语句>→< if关键字>(<表达式>)<复合语句>|(<表达式>)<复合语句>< else关键字><复合语句>
< while语句>→< while关键字>(<表达式>)<复合语句>
< for语句>→< for关键字>(<表达式>;<表达式>;<表达式>)<复合语句>
<复合语句>→{<语句序列>}
<赋值语句>→<表达式>;
<表达式>→<标识符>=<算数表达式>|<布尔表达式>
<布尔表达式>→<算数表达式> |<算数表达式><关系运算符><算数表达式>
<关系运算符>→>|<|>=|<=|==|!=
<算数表达式>→<算数表达式>+<项>|<算数表达式>-<项>|<项>
<项>→<项>*<因子>|<项>/<因子>|<因子>
<因子>→<标识符>|<无符号整数>|(<算数表达式>)
<标识符>→<字母>|<标识符><字母>|<标识符><数字>
<无符号整数>→<数字>|<无符号整数><数字>
<字母>→a|b|…|z|A|B|…|Z
<数字>→0|1|2|3|4|5|6|7|8|9

< main关键字>→main

< if关键字>→if
< else关键字>→else
< for关键字>→for
< while关键字>→while
< int关键字>→int
每行单词数不超过10个

小C语言文法如上，现在我们对小C语言写的一个源程序进行词法分析，分析出关键字、自定义标识符、整数、界符和运算符。

关键字：main if else for while int

自定义标识符：除关键字外的标识符

整数：无符号整数

界符：{ } ( ) , ;

运算符：= + - * / < <= > >= == !=

输入格式:
输入一个小C语言源程序，源程序长度不超过2000个字符，保证输入合法。

输出格式:
按照源程序中单词出现顺序输出，输出二元组形式的单词串。

(单词种类,单词值)

单词一共5个种类：

关键字：用keyword表示

自定义标识符：用identifier表示

整数：用integer表示

界符：用boundary表示

运算符：用operator表示

每种单词值用该单词的符号串表示。

输入样例:
main()
{
int a, b;
if(a == 10)
{
a = b;
}
}
输出样例:
(keyword,main)
(boundary,()
(boundary,))
(boundary,{)
(keyword,int)
(identifier,a)
(boundary,)
(identifier,b)
(boundary,😉
(keyword,if)
(boundary,()
(identifier,a)
(operator,==)
(integer,10)
(boundary,))
(boundary,{)
(identifier,a)
(operator,=)
(identifier,b)
(boundary,😉
(boundary,})
(boundary,})
作者: sdutacm
单位: 浙江大学
时间限制: 400 ms
内存限制: 64 MB
代码长度限制: 16 KB

/*******************
此程序只是将源程序分解为各个单词按顺序输出。
******************/
#include <iostream>
#include <bits/stdc++.h>
using namespace std;
string name[5] = {"keyword","identifier","integer","boundary","operator"};
string key[6] = {"main","if","else","for","while","int"};
void pre(string ch)///处理关键字，自定义标识符，数字
{
    if(ch[0] >= '0'&&ch[0] <= '9') ///以数字开头肯定就是数字了
    {
        cout<<"("<<name[2]<<","<<ch<<")"<<endl;
    }
    else  ///判断是关键字还是自定义的东东。
    {
        int f = 1;
        for(int i = 0; i < 6; i++)
        {
            if(ch == key[i])
            {
                f = 0;
                cout<<"("<<name[0]<<","<<ch<<")"<<endl;
            }
        }
        if(f)
        {
            cout<<"("<<name[1]<<","<<ch<<")"<<endl;
        }
    }
}
int main() ///处理运算符，界符
{
string s;
while(cin>>s)
{
     int len = s.length();
     string temp = "";
     for(int i = 0; i < len; i++)
     {
         if(s[i] == '='||s[i] == '+'||s[i] == '-'||s[i] == '*'||s[i] == '/'||s[i] == '!'||s[i] == '>'||s[i] == '<')
         {
             if(temp.length())
             {
                 pre(temp);
             }
             temp = "";
             if(s[i+1] == '=')///处理==和!=运算符
             {
                 cout<<"("<<name[4]<<","<<s[i]<<s[i+1]<<")"<<endl;
                 i++;
             }
             else
             {
                 cout<<"("<<name[4]<<","<<s[i]<<")"<<endl;
             }
         }
         else if(s[i] == '('||s[i] == ')'||s[i] == '{'||s[i] == '}'||s[i] == ','||s[i] == ';')
            {
                if(temp.length())
                {
                    pre(temp);
                }
                temp = "";
                cout<<"("<<name[3]<<","<<s[i]<<")"<<endl;
            }
            else ///遇到关键字了吗？自定义东东了吗？数字了吗？在这里是判断不出来的。因为其后面是啥东东还不知道，所以不能冲动地输出哦。
            {
                temp+=s[i];
            }
     }
      if(temp.length()) ///搞出来字符串的最后几个符号（一定为非运算符，操作符）
      {
          pre(temp);
      }
}
return 0;
}