词法分析实战

最新推荐文章于 2022-02-12 20:57:00 发布

booirror

最新推荐文章于 2022-02-12 20:57:00 发布

阅读量1.7k

点赞数

分类专栏： CS 重中之重文章标签：编译词法分析 Token

本文链接：https://blog.csdn.net/booirror/article/details/41972211

版权

CS 重中之重专栏收录该内容

4 篇文章 0 订阅

订阅专栏

题目：

在这部分中，你将使用图转移算法手工实现一个小型的词法分析器。
* 分析器的输入：存储在文本文件中的字符序列，字符取自ASCII字符集。文件中可能包括四种记号：关键字if、符合C语言标准的标识符、空格符、回车符\n。
* 分析器的输出：打印出所识别的标识符的种类、及行号、列号信息。

根据题目的要求，定义如下的Token类：

enum TokenType{
TT_ID,
TT_IF
};

class Token {
public:
Token(){}
Token(TokenType _t, string _n, int _l, int _c) { mType = _t; mName = _n; mLine = _l; mColumn = _c; }
~Token(){}
string toString();
TokenType mType;
string mName;
int mLine;
int mColumn;
};

重点实现获取Token的方法：

Token* nextToken(string& input)
{
if (input.empty()) {
return NULL;
}
string name;
int i = 0;
if (input[i] == ' ') {
input = input.substr(1);
gColumn += 1;
return nextToken(input);
}
else if (input[i] == '\n') {
input = input.substr(1);
gLine += 1;
gColumn = 1;
return nextToken(input);
}
else if (input[i] == 'i') {
i++;
name.append("i");
if (input[i] == 'f') {
i++;
name.append("f");
while ((input[i] >= 'a' && input[i] <= 'z') ||
(input[i] >= 'A' && input[i] <= 'Z') ||
(input[i] >= '0' && input[i] <= '9') || input[i] == '_') {
name.append(input.substr(i, 1));
i++;
}
if (name.compare("if") == 0) {
input = input.substr(i);
Token *token = new Token(TT_IF, "", gLine, gColumn);
gColumn += i;
return token;
}
else {
input = input.substr(i);
Token *token = new Token(TT_ID, name, gLine, gColumn);
gColumn += i;
return token;
}
}
else {
while ((input[i] >= 'a' && input[i] <= 'z') ||
(input[i] >= 'A' && input[i] <= 'Z') ||
(input[i] >= '0' && input[i] <= '9') || input[i] == '_') {
name.append(input.substr(i, 1));
i++;
}
input = input.substr(i);
Token *token = new Token(TT_ID, name, gLine, gColumn);
gColumn += i;
return token;
}
}
else if ((input[i] >= 'a' && input[i] <= 'z') ||
(input[i] >= 'A' && input[i] <= 'Z') || input[i] == '_') {
i++;
name.append(input.substr(0, 1));
while ((input[i] >= 'a' && input[i] <= 'z') ||
(input[i] >= 'A' && input[i] <= 'Z') ||
(input[i] >= '0' && input[i] <= '9') || input[i] == '_') {
name.append(input.substr(i, 1));
i++;
}
input = input.substr(i);
Token *token = new Token(TT_ID, name, gLine, gColumn);
gColumn += i;
return token;
}
else {
input = input.substr(1);
gColumn += 1;
return nextToken(input);
}
}

代码比较挫，不多说了，感兴趣的自己看吧。

booirror

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
词法分析实战

题目：在这部分中，你将使用图转移算法手工实现一个小型的词法分析器。* 分析器的输入：存储在文本文件中的字符序列，字符取自ASCII字符集。文件中可能包括四种记号：关键字if、符合C语言标准的标识符、空格符、回车符\n。* 分析器的输出：打印出所识别的标识符的种类、及行号、列号信息。根据题目的要求，定义如下的Token类：enum TokenType{TT_ID,TT
复制链接

扫一扫

专栏目录