听说很经典的一本书,但也的确是很厚的一本书,每天读一些,争取早日读完。每天更新笔记,记录心得,也记录自己。
第三章,程序的机器级表示
从读《编码》的内容了解到,处理器处理的是都是机器码,类似于不同的指令信号,但是现在实际的编程中,多使用的是高级语言。程序经过编译器编译成的可执行文件是机器码的形式。编译器基于编程语言的规则、目标机器的指令集和操作系统遵循的惯例,把程序编译成机器代码。这一过程让我对编译器的设计挺感兴趣,日常中并未注意程序编译过程的一些优化内容,后续可以关注一下编译器的实现。
C源码的编译过程中,需要调用多个处理程序,如下图所示。
在程序的编译过程中,程序指令的编译容易理解,不知道变量是怎么处理的,还有链接器的工作原理还是存疑的。
linux系统中,gcc作为C语言编译器,objdump为反汇编器,可以把机器代码反汇编成汇编代码。
C语言程序中插入汇编代码有时可以减少代码量,比如计算结果是否包含偶数位1,处理器中有PF标志位从硬件上实现,通过汇编调用减少代码量。
C程序中插入汇编方法,一是建立单独的汇编文件,通过链接器实现链接;二是用GCC的内联汇编,用asm伪指令在程序中包含简单汇编代码。
汇编操作指令:
大多数指令有一个或多个操作数,主要为指示执行操作要用到的原数据值,放置结果的目标位置。操作数可以分为三种类型,一为立即数,表示常数值;二为寄存器;三为内存引用,引用内存中存储的值。
汇编指令中很重要的指令是数据传送指令MOV,后面加b,w,l,q表示1,2,4,8字节的传送。
算术和逻辑操作指令,涉及数据和逻辑操作,主要分为四种,加载有限地址、一元操作、二元操作、移位操作。主要包括以下指令,
控制指令:实现程序不同控制流和数据流
跳转指令,程序跳出原来执行位置,转换到新的目标位置执行。跳转指令目标位置有两种编码当时,一种为目标位置与当前指令下一条指令位置的差值编码,另一种为以目标位置实际位置编码。
持续更新……