我们对每个 c 或者汇编文件进行单独编译,但是不去连接,生成很多.o 的文件,这些.o 文件首先是分散的,我们首先要考虑的如何组合起来;其次,这些.o 文件存在相互调用的关系;再者,我们最后生成的 bin 文件是要在硬件中 运行的,每一部分放在什么地址都要有仔细的说明。我觉得在写 makefile 的时候,最为重要的就是 ld 的理解,下面说说我的经验:
首先,要确定我们的程序用没有用到标准的 c库,或者一些系统的库文件,这些一般是在操作系统之上开发要注意的问题,这里并不多说,熟悉在 Linux 编程的人,基本上都会用 ld命令;这里,我们从头开始,直接进行汇编语言的连接。我们写一个汇编程序,控制 GPIO,从而控制外接的 LED,代码如下;
.text
.global _start
_start:
LDR R0,=0x56000010 @GPBCON 寄存器
MOV R1,# 0x00000400
st rR1,[R0]
LDR R0,=0x56000014
MOV R1,#0x00000000
STRR1,[R0]
MAIN_LOOP:
B MAIN_LOOP
代码很简单,就是一个对 io 口进行设置然后写数据。我们看它是如何编译的,注意我们这里使 用的不是 arm-linux-gcc 而是 arm-elf- gcc,二 者之间没 有什么比 较大的 区别,arm-linux-gcc可能包含更多的库文件,在命令行的编译上面是没有区别。我们来看是如何编译的:
arm-elf-gcc-g -c-o led_On.o led_On.s
首先纯编译不连接
arm-elf-ld -Ttext 0x00000000 -g led_On.o -o led_on_elf
用 Ttext 指明我们程序存储的地方,这里生成的是 elf 文件,还不是我们真正的 bin,但是可以借助一些工具可以进行调试。然后:
arm-elf-objcopy -O binary -S led_on_elf led_on.bin
生成 bin 文件。
-T 选项是 ld 命令中比较重要的一个选项,可以用它直接指明代码的代码段、数据段、bss段,对于复杂的连接,可以专门写一个脚本来告诉编译器如何连接。
-Ttext
addr
-Tdata
addr
-Tbss
addr
arm-elf-ld
-Ttext 0x00000000 -g led_On.o -o led_on_elf,运行地址为0x00000000,由于没有指明数据段和 bss,他们会默认的依次放在后面。相同的代码 不同的 Ttext,你可以对比一下他们之间会变的差异,ld 会自动调整跳转的地址。第二个概念:section,section 可以理解成一块,例如像 c 里面的一个子函数,就是一个 section,链接器 ld 把 object 文件中 的每个 section 都作为一个整体,为其分配运行的地址(memorylayout),这个过程就是重定位(relocation);最后把所有目标文件合并为一个目标文件。链接通过一个 linker script 来控制,这个脚本描述了输入文件的 sections 到输出文件的映射,以及输出文件的 memory layout。
因此,linker 总会使用一个 linker script,如果不特别指定,则使用默认的 script;可以使用‘-T’
命令行选项来指定一个 linker script。
*映像文件的输入段与输出段linker 把多个输入文件合并为一个输出文件。输出文件和输入文件都是目标文件(object file),输出文件通常被称为可执行文件(executable)。每个目标文件都有一系列 section,输入文件的 section 称为 input section,输出文件的 section则称为 output section。一 个 section 可以是 loadable 的,即输出文件运行时需要将这样的 section 加载到 memory(类似于 RO&RW段);也可以是 allocatable 的,这样的 section 没有任何内容,某些时候用0对相应的 memory 区域进行初始化(类似于 ZI 段);如果一个 section 既非 loadable 也非
allocatable,则它通常包含的是调试信息。每个 loadable 或 allocatable 的 output section 都有两个地址,一是 VMA(virtual memoryaddress),是该 section 的运行时域地址;二是 LMA(load memory address),是该 section 的加
载时域地址。可以通过 objdump 工具附加'-h'选项来查看目标文件中的 sections。
*简单的 Linker script
(1) SECTIONS 命令:
TheSECTIONS command tells the linker how to map input sections into output sections, and how
to placethe output sections in memory.
命令格式如下:
SECTIONS
{
sections-command
sections-command
......
}
其中 sections-command 可以是 ENTRY 命令,符号赋值,输出段描述,也可以是 overlay 描述。
(2) 地址计数器‘.’(location counter):
该符号只能用于 SECTIONS 命令内部,初始值为‘0’,可以对该符号进行赋值,也可以使用该符号进行计算或赋值给其他符号。它会自动根据 SECTIONS 命令内部所描述的输出段的大小来计算当前的地址。
(3) 输出段描述(output section description):
前面提到在 SECTIONS 命令中可以作输出段描述,描述的格式如下:
section [address] [(type)]: [AT(lma)]
{
output-section-command
output-section-command
...
} [>region] [AT>lma_region] [:phdr :phdr ...] [=fillexp]
很多附加选项是用不到的。其中的 output-section-command 又可以是符号赋值,输入段描述,要直接包含的数据值,或者某一特定的输出段关键字。
*linker script 实例
==============================
OUTPUT_ARCH(arm)
ENTRY(_start)
SECTIONS {
. = 0xa3f00000;
__boot_start= .;
.startALIGN(4) : {
*(.text.start)
}
.setup ALIGN(4) : {
setup_block = .;
*(.setup)
setup_block_end = .;
}
.textALIGN(4) : {
*(.text)
}
.rodataALIGN(4) : {
*(.rodata)
}
.dataALIGN(4) : {
*(.data)
}
.gotALIGN(4) : {
*(.got)
}
__boot_end = .;
.bssALIGN(16) : {
bss_start= .;
*(.bss)
*(COMMON)
bss_end = .;
}
.commentALIGN(16) : {
*(.comment)
}
stack_point = __boot_start + 0x00100000;
loader_size = __boot_end - __boot_start;
setup_size = setup_block_end - setup_block;
}
=============================
在 SECTIONS 命令中的类似于下面的描述结构就是输出段描述:
.startALIGN(4) : {
*(.text.start)
}
.start 为 output section name,ALIGN(4)返回一个基于 location counter(.)的4字节对齐的地址值。*(.text.start)是输入段描述,*为通配符,意思是把所有被链接的 object 文件中 的.text.start段都链接进这个名为.start 的输出段。
源文件中所标识的 section 及其属性实际上就是对输入段的描述,例如.text.start 输入段在源文件 start.S 中的代码如下:
.section .text.start
.global _start
_start :
b start
arm-elf-ld -Ttimer.lds -o timer_elf header .o
这里就必须存在一个 timer.lds 的文件。
对于.lds 文件,它定义了整个程序编译之后的连接过程,决定了一个可执行程序的各个段的存储位置。虽然现在我还没怎么用它,但感觉还是挺重要的,有必要了解一下。
先看一下 GNU 官方网站上对.lds 文件形式的完整描述:
SECTIONS {
...
secnamestart BLOCK(align) (NOLOAD) : AT (ldadr )
{contents } >region :phdr =fill
...
}
secname 和 contents 是必须的,其他的都是可选的。下面挑几个常用的看看:
1、secname:段名
2、contents:决定哪些内容放在本段,可以是整个目标文件,也可以是目标文件中的某段(代码段、数据段等)
3、start:本段连接(运行)的地址,如果没有使用 AT(ldadr),本段存储的地址也是start。GNU 网站上说 start 可以用任意一种描述地址的符号来描述。
4、AT(ldadr):定义本段存储(加载)的地址。
/* nand.lds */
SECTIONS {
firtst 0x00000000 : { head.o init.o }
second 0x30000000 : AT(4096) { main.o }
}
以上,head.o 放在0x00000000地址开始处,init.o 放在 head.o 后面,他们的运行地址也是0x00000000,即连接和存储地址相同(没有 AT 指定);main.o 放在4096(0x1000,是 AT 指定的,存储地址)开始处,但是它的运行地址在0x30000000,运行之前需要从0x1000(加载处)复制到0x30000000(运行处),此过程也就用到了读取 Nand flash。这就是存储地址和连接(运行)地址的不同,称为加载时域和运行时域,可以在.lds 连
接脚本文件中分别指定。编写好的.lds 文件,在用 arm-linux-ld 连接命令时带-Tfilename 来调用执行,如
arm-linux-ld –Tnand.lds x.o y.o –o xy.o。也用-Ttext 参数直接指定连接地址,如
arm-linux-ld –Ttext 0x30000000 x.o y.o –o xy.o。
既然程序有了两种地址,就涉及到一些跳转指令的区别,这里正好写下来,以后万一忘记了也可查看,以前不少东西没记下来现在忘得差不多了。
ARM 汇编中,常有两种跳转方法:b 跳转指令、ldr 指令向 PC 赋值。
我自己经过归纳如下:
b step1:b 跳转指令是相对跳转,依赖当前 PC 的值,偏移量是通过该指令本身的 bit[23:0]算出来的,这使得使用 b 指令的程序不依赖于要跳到的代码的位置,只看指令本身。
ldr pc, =step1:该指令是从内存中的某个位置(step1)读出数据并赋给 PC,同样依赖当前 PC 的值,但是偏移量是那个位置(step1)的连接地址(运行时的地址),所以可以用它实现从 Flash 到 RAM 的程序跳转。
此外,有必要回味一下 adr 伪指令,U-boot 中那段 relocate 代码就是通过 adr 实现当前程序是在 RAM 中还是 flash 中。仍然用我当时的注释
adr r0, _start /* r0是代码的当前位置 */
/* adr 伪指令,汇编器自动通过当前 PC 的值算出 如果执行到_start 时 PC 的值,放到 r0中:当此段在 flash 中执行时 r0 = _start = 0;当此段在 RAM 中执行时_start = _TEXT_BASE(在board/smdk2410/config.mk 中指定的值为0x33F80000,即 u-boot 在把代码拷贝到 RAM 中去执行的代码段的开始) */
ldr r1, _TEXT_BASE /*测试判断是从 Flash 启动,还是 RAM */
/*此句执行的结果 r1始终是0x33FF80000,因为此值是又编译器指定的(ads 中设置,或-D
设置编译器参数) */
cmp r0, r1 /*比较 r0和 r1,调试的时候不要执行重定位 */下面,结合 u-boot.lds 看看一个正式的连接脚本文件。这个文件的基本功能还能看明白,虽然上面分析了好多,但其中那些 GNU 风格的符号还是着实让我感到迷惑。
OUTPUT_FORMAT("elf32­littlearm", "elf32­littlearm", "elf32­littlearm")
;指定输出可执行文件是 elf 格式,32位 ARM 指令,小端
OUTPUT_ARCH(arm)
;指定输出可执行文件的平台为 ARM
ENTRY(_start)
;指定输出可执行文件的起始代码段为_start.
SECTIONS
{
. = 0x00000000 ;从0x0位置开始
. = ALIGN(4) ;代码以4字节对齐
.text : ;指定代码段
{
cpu/arm920t/start.o (.text) ;代码的第一个代码部分
*(.text) ;其它代码部分
}
. = ALIGN(4)
.rodata : { *(.rodata) } ;指定只读数据段
. = ALIGN(4);
.data : { *(.data) } ;指定读/写数据段
. = ALIGN(4);
.got : { *(.got) } ;指定 got段, got 段式是 uboot 自定义的一个段,非标准段
__u_boot_cmd_start = . ;把__u_boot_cmd_start 赋值为当前位置,即起始位置
.u_boot_cmd : { *(.u_boot_cmd) } ;指定 u_boot_cmd 段, uboot 把所有的 uboot 命令放在该段.
__u_boot_cmd_end = .;把__u_boot_cmd_end 赋值为当前位置,即结束位置
. = ALIGN(4);
__bss_start = .;把__bss_start 赋值为当前位置,即 bss 段的开始位置
.bss : { *(.bss) };指定 bss 段
_end = .;把_end赋值为当前位置,即 bss 段的结束位置
}
2251

被折叠的 条评论
为什么被折叠?



