上一篇博文介绍了编译器翻译的过程,本篇博文对翻译过程的第一步词法分析进行讲解。
词法分析
词法分析的主要任务:1.对源程序的代码进行从左到右的逐行扫描,识别出各个单词,从而确定单词的类型。
2.将识别出的单词转换为统一的机内表示——词法单元(token)形式,token:<种别码,属性值>
第二点看不懂没事,先说说什么是词法单元形式,token是一个键值对,key是种别码,什么是种别码?请看下图便会知晓。
当我们写代码时,是不是需要用到这些单词类型,现在是不是有一种似懂非懂的感觉。
上图中种别码大概分为一词一码、一型一码、多词一码等。
一词一码:例如当你写 if 这个词的时候便可以从已经写好的种别内容中找到该词并确定它的类型,也就是该词预先就定义好的。
多词一码:在定义变量时,变量名是我们自己定义的,你不能从种别内容中找到该词,所以会用一个集合把该词存入其中,也就是并没有预先定义的词。
一型一码:不能从种别内容中找到你定义该常量的值,但是能找到你定义该值的类型。
总结上面的种别码:一对一则表示在种别内容中预先定义好的,多对一则表示在种别内容中没有预先定义,是使用者自己定义的。
token:<种别码,属性值>,种别码就是类型,属性值就是值,类似Map中的key,value的形式。
下图是词法分析后得到的token序列(使用的是宏定义,后面会解释),下图中,没有value的则表示是预先在种别内容中定义好的。
好了,此部分内容便到此结束,下面继续看语法分析。