学习朱有鹏老师的裸机课程摘抄
1.位置有关编码
-
位置有关编码:汇编源码编码成二进制可执行程序后和内存地址是有关的
在设计一个程序时,会给这个程序指定一个运行地址(链接地址)。就是说我们在编译程序时其实心里是知道我们程序将来被运行时的地址(运行地址)的,而且必须给编译器链接器指定这个地址(链接地址)才行。最后得到的二进制程序理论上是和你指定的运行地址有关的,将来这个程序被执行时必须放在当时编译链接时给定的那个地址(链接地址)下才行,否则不能运行(就叫位置有关代码)。但是
-
位置无关编码(PIC,position independent code):汇编源文件被编码成二进制可执行程序时编码方式与位置(内存地址)无关。
有个别特别的指令他可以跟指定的地址(链接地址)没有关系,也就是说这些代码实际运行时不管放在哪里都能正常运行。
-
对比:位置无关代码要好一些,适应性强,放在哪里都能正常运行;位置有关代码就必须运行在链接时指定的地址上,适应性差。位置无关码有一些限制,不能完成所有功能,有时候不得不使用位置有关代码。
2.链接地址和运行地址
-
对于位置有关代码来说:最终执行时的运行地址和编译链接时给定的链接地址必须相同,否则一定出错。
Makefile中用
-Ttext 0x0
来指定链接地址是0x0。这意味着我们认为这个程序将来会放在0x0这个内存地址去运行。但是实际上我们运行时的地址是0xd0020010(我们用dnw下载时指定的下载地址)。这两个地址看似不同,但是实际相同。这是因为S5PV210内部做了映射,把SRAM映射到了0x0地址去。 -
链接地址:链接地址是由程序员在编译链接的过程中,通过Makefile中
-Ttext xxx
或者在链接脚本中指定的。程序员事先会预知自己的程序的执行要求,并且有一个期望的执行地址,并且会用这个地址来做链接地址。 -
运行地址:程序实际运行时地址(指定方式:由实际运行时被加载到内存的哪个位置说了算),编译链接时是无法绝对确定运行时地址的。
-
举例:210中的裸机程序。运行地址由我们下载时确定,下载时下载到0xd0020010,所以就从这里开始运行。这个下载地址也不是随意定的,是iROM中的BL0加载BL1时事先指定好的地址,这是由CPU的设计决定的)。所以理论上编译链接时应该将地址指定到0xd0020010,但是实际上我们在之前裸机程序中都是使用位置无关码PIC,所以链接地址可以是0。
3. S5PV210的启动过程
-
三星推荐
bootloader必须小于96KB并大于16KB,假定bootloader为80KB,启动过程是这样子:先开机上电后BL0运行,BL0会加载外部启动设备中的bootloader的前16KB(BL1)到SRAM中去运行,BL1运行时会加载BL2(bootloader中80-16=64KB)到SRAM中(从SRAM的16KB处开始用)去运行;BL2运行时会初始化DDR并且将OS搬运到DDR去执行OS,启动完成。
-
uboot实际使用的方式
uboot大小随意,假定为200KB。启动过程是这样子:先开机上电后BL0运行,BL0会加载外部启动设备中的uboot的前16KB(BL1)到SRAM中去运行,BL1运行时会初始化DDR,然后将整个uboot搬运到DDR中,然后用一句长跳转(从SRAM跳转到DDR)指令从SRAM中直接跳转到DDR中继续执行uboot直到uboot完全启动。uboot启动后在uboot命令行中去启动OS。
4. 为什么需要重定位
- 链接地址和运行地址有时候必须不相同,而且还不能全部用位置无关码,这时候只能重定位。
5. 从源码到可执行程序的步骤
- 预编译:预编译器执行。譬如C中的宏定义就是由预编译器处理,注释等也是由预编译器处理的。
- 编译:编译器来执行。把源码.c .S编成机器码.o文件。
- 链接: 链接器来执行。把.o文件中的各函数(段)按照一定规则(链接脚本来指定)累积在一起,形成可执行文件。
- strip: strip是把可执行程序中的符号信息给拿掉,以节省空间。(Debug版本和Release版本)
- objcopy:由可执行程序生成可烧录的镜像bin文件。
6.程序段
- 段就是程序的一部分,我们把整个程序的所有东西分成了一个一个的段,给每个段起个名字,然后在链接时就可以用这个名字来指示这些段。也就是说给段命名就是为了在链接脚本中用段名来让段站在合适的位置。
- 段名分为2种:一种是编译器链接器内部定好的,先天性的名字;一种是程序员自己指定的、自定义的段名。
- 先天性段名:
- 代码段:(.text),又叫文本段,代码段其实就是函数编译后生成的东西
- 数据段:(.data),数据段就是C语言中有显式初始化为非0的全局变量
- bss段:(.bss),又叫ZI(zero initial)段,就是零初始化段,对应C语言中未初始化的全局变量。
- 后天性段名:
段名由程序员自己定义,段的属性和特征也由程序员自己定义。
- 先天性段名:
- 举例
- C语言中全局变量如果未显式初始化,值是0。本质就是C语言把这类全局变量放在了bss段,从而保证了为0。
- C运行时环境如何保证显式初始化为非0的全局变量的值在main之前就被赋值了?就是因为它把这类变量放在了.data段中,而.data段会在main执行之前被处理(初始化)。
7. 链接脚本作用
- 链接脚本其实是个规则文件,他是程序员用来指挥链接器工作的。链接器会参考链接脚本,并且使用其中规定的规则来处理.o文件中那些段,将其链接成一个可执行程序。
- 链接脚本的关键内容有2部分:段名 + 地址(作为链接地址的内存地址)。链接脚本的理解:
- SECTIONS {} 这个是整个链接脚本
- . 点号在链接脚本中代表当前位置。
- = 等号代表赋值
8. 重定位
- 重定位实际就是在运行地址处执行一段位置无关码PIC,让这段PIC(也就是重定位代码)从运行地址处把整个程序镜像拷贝一份到链接地址处,完了之后使用一句长跳转指令从运行地址处直接跳转到链接地址处去执行同一个函数(led_blink),这样就实现了重定位之后的无缝连接。
- 假如在SRAM中将代码从0xd0020010重定位到0xd0024000。当我们把代码链接地址设置为0xd0024000时,实际隐含意思就是我这个代码将来必须放在0xd0024000位置才能正确执行。如果实际运行地址不是这个地址就要出事(除非代码是PIC位置无关码)。所以代码执行时通过代码前段的少量位置无关码将整个代码搬移到0xd0024000,再使用一个长跳转跳转到0xd0024000处的代码继续执行,重定位完成
- 长跳转:首先这句代码是一句跳转指令(ARM中的跳转指令就是类似于分支指令B、BL等作用的指令),跳转指令通过给PC(r15)赋一个新值来完成代码段的跳转执行。长跳转指的是跳转到的地址和当前地址差异比较大,跳转的范围比较宽广。即使用
ldr pc, =led_blink
这句长跳转直接从0xd0020010处代码跳转到0xd0024000开头的那一份代码的led_blink函数处去执行。如果短跳转bl led_blink
则执行的就是0xd0020010开头的这一份,如果长跳转ldr pc, =led_blink
则执行的是0xd0024000开头处的这一份)。这就是短跳转和长跳转的区别。 - 执行完代码重定位后,实际上在SRAM中有2份代码的镜像(一份是我们下载到0xd0020010处开头的,另一份是重定位代码复制到0xd0024000处开头的),这两份内容完全相同,仅仅地址不同。如果短跳转
bl led_blink
则执行的就是0xd0020010开头的这一份,如果长跳转ldr pc, =led_blink
则执行的是0xd0024000开头处的这一份)。这就是短跳转和长跳转的区别。