NASM
源代码分析之预处理(
2
)
在NASM预处理中,每次从源代码中读取一行,并保存于数据结构Line中。Line指代已经被Token化后的一行源代码。
struct Line
// 指代一行代码(经过函数tokenise(char *line)处理后的,其中参数插入char *line为源程序中代码)。
{
Line *next; // Line链表
MMacro *finishes;
Token *first; // 指向代表"处理后的一行代码"的Token链的第一个元素
};
first指向代表该行代码的Token链表,结合《nasm源代码分析之预处理(1)》中的图,如果当前行代码是:“inc al;”,first就指向Token的链表头。
finishes项只有当Line结构指代多行宏的时候才有效,这个以后会有详述。
对于宏定义语句形如:
#define TRUE 1
#define f(x) (2*x+3)
在NASM中称为单行宏,以区别于用用 %macro...%endmarco 定义的多行宏。单行宏由数据结构struct SMacro表示:
struct SMacro
{
SMacro *next;
char *name; // 单行宏名
int casesense; // 大小写敏感?
int nparam; // 参数个数
int in_progress;
Token *expansion; // 对应的Token链表
};
name很容易理解,例如宏定义:#define foo(x) (2*x+3) ,则name=“foo”。
casesense代表该宏是否大小写敏感,如果casesense==0,则不敏感,即foo(x)、FOo(x)、FOO(x)和fOO(x)指的是同一个宏。casesense!=0,则大小写敏感,即代表的是不同的宏。
nparam指宏的参数个数,上例中参数个数,即nparam=1,如果宏定义为:
#define MYSTRING “Hello World”,则nparam = 0。可参见函数:preproc.c/mstrcmp()。
in_progress指当前是否有在读取该宏定义。
从本质上来说,struct SMacro代表的也是一行代码,和struct Line差不多,只是Line泛指一般的代码行。所以在SMacro中,Token *expansion的含义和Line中的Token *first项是一样的。