这个问题很有意思:
C语言的编译器,是用C语言写的。
什么?C语言是用C语言写的,这不就是“鸡生蛋,蛋生鸡”的问题吗?
要让C语言编译通过,就需要一个C语言编译器。但是C语言编译器是用C写的。那么世界上第一个能执行的编译器,是如何编译的呢?
这种编译器也用语言本身写的特性,称之为“自举”。
奇怪的是,这么一个让我们纳闷的问题,却很少有人提到。似乎大神们觉得很自然,不屑于说明。
直到后来学到一些编译相关的技术,才慢慢了解到这件事的原委。原因不复杂,我简化一下表述:
1.首先,简化C语言的设计,只选择最最基本、不得不实现的功能,形成一个C语言的子集。我们可以叫它C0。
2.用汇编语言实现C0语言的编译器,由于C0功能很少,比较容易直接写一个编译器。
3.用C0语言去实现更多必要的功能,由于C0语言功能太弱,遇到不好写的地方可以用汇编来打补丁。最终你得到了一个改进版的C0语言,我们称之为C1。
4.用C1语言去继续实现更多C语言功能,不好写的地方继续用汇编打补丁。可以得到C2语言
5.用C2语言去继续实现更多C语言功能,不好写的地方继续用汇编打补丁。可以得到C3语言
6.以此类推……
7.到Cn语言的时候,你已经得到了一个足够接近C语言的编译器。