C语言词法分析程序(小C语言)

A - 小C语言–词法分析程序(C语言版)1

Description

小C语言文法

<程序>→<main关键字>(){<声明序列><语句序列>}

<声明序列>→<声明序列><声明语句>|<声明语句>|<空>

<声明语句>→<标识符表>;

<标识符表>→<标识符>,<标识符表>|<标识符>

<语句序列>→<语句序列><语句>|<语句>

<语句>→< if语句>|< while语句>|< for语句>|<复合语句>|<赋值语句>

< if语句>→< if关键字>(<表达式>)<复合语句>|(<表达式>)<复合语句>< else关键字><复合语句>

< while语句>→< while关键字>(<表达式>)<复合语句>

< for语句>→< for关键字>(<表达式>;<表达式>;<表达式>)<复合语句>

<复合语句>→{<语句序列>}

<赋值语句>→<表达式>;

<表达式>→<标识符>=<算数表达式>|<布尔表达式>

<布尔表达式>→<算数表达式> |<算数表达式><关系运算符><算数表达式>

<关系运算符>→>|<|>=|<=|==|!=

<算数表达式>→<算数表达式>+<项>|<算数表达式>-<项>|<项>

<项>→<项>*<因子>|<项>/<因子>|<因子>

<因子>→<标识符>|<无符号整数>|(<算数表达式>)

<标识符>→<字母>|<标识符><字母>|<标识符><数字>

<无符号整数>→<数字>|<无符号整数><数字>

<字母>→a|b|…|z|A|B|…|Z

<数字>→0|1|2|3|4|5|6|7|8|9

< main关键字>→main

< if关键字>→if

< else关键字>→else

< for关键字>→for

< while关键字>→while

< int关键字>→int

每行单词数不超过10个
小C语言文法如上,现在我们对小C语言写的一个源程序进行词法分析,分析出关键字、自定义标识符、整数、界符
和运算符。
关键字:main if else for while int
自定义标识符:除关键字外的标识符
整数:无符号整数
界符:{ } ( ) , ;
运算符:= + - * / < <= > >= == !=

Input

输入一个小C语言源程序,源程序长度不超过2000个字符,保证输入合法。

Output

按照源程序中单词出现顺序输出,输出二元组形式的单词串。

(单词种类,单词值)

单词一共5个种类:

关键字:用keyword表示
自定义标识符:用identifier表示
整数:用integer表示
界符:用boundary表示
运算符:用operator表示

每种单词值用该单词的符号串表示。

Sample

input

main()
{
int a,b;
if(a==10)
{
a=b;
}
}

output

(keyword,main)
(boundary,()
(boundary,))
(boundary,{)
(keyword,int)
(identifier,a)
(boundary,,)
(identifier,b)
(boundary,;)
(keyword,if)
(boundary,()
(identifier,a)
(operator,==)
(integer,10)
(boundary,))
(boundary,{)
(identifier,a)
(operator,=)
(identifier,b)
(boundary,;)
(boundary,})
(boundary,})

在这里插入图片描述

代码:

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
int main()
{
    char str[85], s[85];
    int i, j, len;
    memset(str,0,sizeof(str));
    while(gets(str) != NULL)
    {
    len = strlen(str);
    j = 0;
    memset(s, 0, sizeof(s));
    for(i = 0; i < len; i++)
    {
        if((str[i] >= 'A' && str[i] <= 'Z') || (str[i] >= 'a' && str[i] <= 'z'))
        {
            for(; i < len; i++)
            {
                if((str[i] >= 'A' && str[i] <= 'Z') || (str[i] >= 'a' && str[i] <= 'z') || (str[i] >= '0' && str[i] <= '9'))
                {
                    s[j++] = str[i];
                }
                else
                {
                    break;
                }
            }
            s[j] = '\0';
            if(strcmp(s,"main") == 0 || strcmp(s,"if") == 0 || strcmp(s,"else") == 0 || strcmp(s,"for") == 0 || strcmp(s,"while") == 0 || strcmp(s,"int") == 0)
            {
                printf("(keyword,%s)\n",s);
            }
            else
            {
                printf("(identifier,%s)\n",s);
            }
            memset(s,0,sizeof(s));
            j = 0;
            i = i - 1;
        }
        else if(str[i] == '(' || str[i] == ')' || str[i] == '{' || str[i] == '}' || str[i] == ',' || str[i] == ';')
        {
            printf("(boundary,%c)\n",str[i]);
        }
        else if(str[i] >= '0' && str[i] <= '9')
        {
                for(; i < len; i++)
                {
                    if(str[i] >= '0' && str[i] <= '9')
                    {
                        s[j++] = str[i];
                    }
                    else
                    {
                        break;
                    }
                }
                s[j] = '\0';
                printf("(integer,%s)\n",s);
                memset(s,0,sizeof(s));
                j = 0;
                i = i - 1;
        }
        else if(str[i] == '=' || str[i] == '+' || str[i] == '-' || str[i] == '*' || str[i] == '/' || str[i] == '<' || str[i] == '>' || str[i] == '!')
            {
                if(i == len - 1)
                {
                    printf("(operator,%c)\n",str[i]);
                }
                else
                {
                    if(str[i + 1] == '=')
                    {
                        printf("(operator,%c%c)\n",str[i],str[i + 1]);
                        i += 1;
                    }
                    else
                    {
                        printf("(operator,%c)\n",str[i]);
                    }
                }
            }
    }
    memset(str,0,sizeof(str));
    }
    return 0;
}

  1. https://blog.csdn.net/qq_43618642/article/details/117134930 ↩︎

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
一、实验目的: 通过设计编制调试一个具体的词法分析程序,加深对词法分析原理的理解。并掌握在对程序设计语言程序进行扫描过程中将其分解为各类单词的词法分析方法。 编制一个读单词过程,从输入的源程序中,识别出各个具有独立意义的单词,即基本保留字、标识符、常数、运算符、分隔符五大类。并依次输出各个单词的内部编码及单词符号自身值。(遇到错误时可显示“Error”,然后跳过错误部分继续显示) 二、实验预习提示 1、词法分析器的功能和输出格式 词法分析器的功能是输入源程序,输出单词符号。词法分析器的单词符号常常表示成以下的二元式(单词种别码,单词符号的属性值)。本实验中,采用的是按类来安排种别码的方式。 2、部分单词的BNF表示(可参考教材43页的状态转换图) -> ->|| |ε -> -> |ε -> + -> - -> > -> >= 3、 做词法分析器需要把对象语言的词法全部描述出来,在这我们取C语言子集,它的词法如下: (1)关键字 main if else int return void while…….. 所有的关键字都是小写。 (2)专用符号 = + - * / <= > >= == != ; : , { } [ ] ( ) (3)空格和空白、制表符和换行符。 空格一般用来分隔ID、NUM、专用符号和关键字,在词法分析阶段通常被忽略。 各种单词符号的种别码,这是一种符号一个编码的设计。只供参考! 单词符号 种别码 单词符号 种别码 main 2 [ 28 int 1 ] 29 char 3 { 30 If 4 } 31 else 5 , 32 for 6 : 33 while 7 ; 34 ID 10 > 35 NUM 20 = 37 + 22 +”,当前字符为’>’,此时,分析器倒底是将其分析为大于关系运算符还是大于等于关系运算符呢?显然,只有知道下一个字符是什么才能下结论。于是分析器读入下一个字符’+’,这时可知应将’>’解释为大于运算符。但此时,超前读了一个字符’+’,所以要回退一个字符,词法分析器才能正常运行。在分析标识符,无符号整数等时也有类似情况。 5、模块结构 见附图 三、实验过程和指导: (一)准备: 1.阅读课本有关章节,明确语言的语法,写出基本保留字、标识符、常数、运算符、分隔符和程序例。 2.编制好程序。 3.准备好多组测试数据。 (二)上机调试: (三)程序要求: 程序输入/输出示例: 如源程序C语言。输入如下一段: main() { int a,b; a = 10; b = a + 20; } 要求输出如右图。 (2,“main”) (5,“(” ) (5,“ )” ) (5,“{ ” ) (1,“int” ) (2,“a” ) (5,“,” ) (2,“b” ) (5,“;” ) (2,“a” ) (4,“=” ) (3,“10” ) (5,“;” ) (2,“b” ) (4,“=” ) (2,“a” ) (4,“+” ) (3,“20” ) (5,“;” ) (5,“}” ) 说明: 识别保留字:if、int、for、while、do、return、break、continue; 单词种别码为1。 其他的都识别为标识符;单词种别码为2。 常数为无符号整形数;单词种别码为3。 运算符包括:+、-、*、/、=、>、=、<=、!= ;单词种别码为4。 分隔符包括:,、;、{、}、(、); 单词种别码为5。 以上为参考,具体可自行增删。 程序思路(参考): 这里以开始定义的C语言子集的源程序作为词法分析程序的输入数据。在词法分析中,自文件头开始扫描源程序字符,一旦发现符合“单词”定义的源程序字符串时,将它翻译成固定长度的单词内部表示,并查填适当的信息表。 经过词法分析后,源程序字符串(源程序的外部表示)被翻译成具有等长信息的单词串(源程序的内部表示),并产生两个表格:常数表和标识符表,它们分别包含了源程序中的所有常数和所有标识符。 0.定义部分:定义常量、变量、数据结构。 1.初始化:从文件将源程序全部输入到字符缓冲区中。 2.取单词前:去掉多余空白。 3.取单词后:去掉多余空白(可选,看着办)。 4.取单词:利用实验一的成果读出单词的每一个字符,组成单词,分析类型。(关键是如何判断取单词结束?取到的单词是什么类型的单词?) 5.显示结果。 为了设计好程序,注意以下事情: 1.模块设计:将程序分成合理的多个模块(函数),每个模块做具体的同一事情。 2.写出(画出)设计方案:模块关系简图、流程图、全局变量、函数接口等。 3.编程时注意编程风格:空行的使用、注释的使用、缩进的使用等。
以下是一个简单的 C 语言词法分析程序,它可以读取 C 语言源代码并输出每个标识符、关键字、常量和运算符: ```c #include <stdio.h> #include <ctype.h> #include <string.h> #define MAX_LENGTH 100 int main() { char ch, buffer[MAX_LENGTH]; FILE *fp; int i, j, k, len; fp = fopen("example.c", "r"); if (fp == NULL) { printf("Error opening file!"); return 0; } while ((ch = fgetc(fp)) != EOF) { if (isalpha(ch)) { i = 0; buffer[i++] = ch; while (isalnum(ch = fgetc(fp))) buffer[i++] = ch; buffer[i] = '\0'; fseek(fp, -1, SEEK_CUR); if (strcmp(buffer, "if") == 0 || strcmp(buffer, "else") == 0 || strcmp(buffer, "while") == 0 || strcmp(buffer, "for") == 0) printf("%s is a keyword\n", buffer); else printf("%s is an identifier\n", buffer); } else if (isdigit(ch)) { i = 0; buffer[i++] = ch; while (isdigit(ch = fgetc(fp))) buffer[i++] = ch; buffer[i] = '\0'; fseek(fp, -1, SEEK_CUR); printf("%s is a constant\n", buffer); } else if (ch == '+' || ch == '-' || ch == '*' || ch == '/' || ch == '>' || ch == '<' || ch == '=' || ch == '&' || ch == '|') { if (ch == '>' || ch == '<' || ch == '=') { if ((ch = fgetc(fp)) == '=') printf("%c%c is a relational operator\n", buffer[0], ch); else { fseek(fp, -1, SEEK_CUR); printf("%c is an arithmetic operator\n", buffer[0]); } } else if (ch == '&' || ch == '|') { if ((ch = fgetc(fp)) == buffer[0]) printf("%c%c is a logical operator\n", buffer[0], ch); else { fseek(fp, -1, SEEK_CUR); printf("%c is an invalid operator\n", buffer[0]); } } else printf("%c is an arithmetic operator\n", ch); } } fclose(fp); return 0; } ``` 该程序使用标准 C 库中的函数来读取源代码并从中提取标识符、关键字、常量和运算符。程序通过逐个字符读取源代码并根据字符的类型进行处理。如果字符是字母,则将其存储在缓冲区中,并读取后续的字母或数字,直到遇到非字母数字字符为止。然后,程序将缓冲区中的内容与关键字列表进行比较,以确定是否为关键字。如果不是关键字,则认为它是标识符。 如果字符是数字,则程序将其存储在缓冲区中,并读取后续的数字,直到遇到非数字字符为止。然后,程序将缓冲区中的内容视为常量。 如果字符是运算符,则程序将其与可能的后续字符进行比较以确定其是何种类型的运算符,例如算术运算符、关系运算符或逻辑运算符。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值