在上一篇文章中,大致介绍了下编译过程。从这篇文章开始,我们就开始逐步慢慢深入的学习编译过程中的步骤。今天我们就来具体看看词法分析到底是怎么回事。
========================华丽丽的分割线============================================
int fun(int a,int c);
int m=10;
int main()
{
int i=4;
int j=5;
m = fun(i,j);
return 0;
}
int fun(int a,int b)
{
int c=0;
c=a+b;
return c;
}
对于如上源码,在计算机上存储的形式与如上我们看到的形式不同,以16进制形式展现的话,上述c语言代码看上去就是:
696E742066756E28696E7420612C696E
742063293B0D0A696E74206D3D31303B
0D0A696E74206D61696E28290D0A7B0D
0A20202020696E7420693D343B0D0A20
202020696E74206A3D353B0D0A202020
206D203D2066756E28692C6A293B0D0A
2020202072657475726E20303B0D0A7D
0D0A0D0A696E742066756E28696E7420
612C696E742062290D0A7B0D0A202020
20696E7420633D303B0D0A2020202063
3D612B623B0D0A202020207265747572
6E20633B0D0A7D
看到上述的一连串数字,心里肯定想:这TM啥玩意?给个提示:想到了ASCII码表了么?明白了吧。
好,咱们现在就根本ASCII码表,来翻译上述一连串数字到底是啥玩意:
69 6E 74 20 66 75 6E 28 69 6E 74 20 61 2C 69 6E
i n t 空格 f u n ( i n t 空格 a , i n
74 20 63 29 3B 0A 69 6E 74 20 6D 3D 31 30 3B
t 空格 b ) ; \n i n t 空格 m = 1 0 ;
……
根据不同语言的要求,遍历一连串数字,切分出符号并提取出信息。
例如对于c语言来说,可用使用如下状态图来切分符号,提取出标识符、数字、符号等。
一句话总结:词法分析就是根据输入的一连串数据,根据语言特性,切分出有用的标识符、符号等信息,为下一步语法分析做准备。