ARM-GCC-LD脚本入门讲解

基础

什么是链接脚本

链接脚本是由链接器使用的文件,用于控制程序的内存布局,指定代码和数据在内存中的位置。

链接脚本可以确保代码和数据被放置在正确的位置,避免冲突和溢出问题。

编译、汇编和链接的基本概念

  • 编译:将源代码(如C或C++)转换为汇编语言。
  • 汇编:将汇编语言转换为机器代码。
  • 链接:将多个对象文件和库合并成一个单一的可执行文件。

各种内存区域 (RAM, ROM, Stack, Heap)

  • RAM:用于存储变量和程序数据。
  • ROM:用于存储程序代码和常量数据。
  • Stack:用于存储局部变量和函数调用的返回地址。
  • Heap:用于动态内存分配。

内存分配策略

两种主要的内存分配策略: 静态内存分配和动态内存分配

静态内存分配是在编译时进行的,它的大小和位置在程序运行期间是不变的。全局变量和局部静态变量是静态内存分配的例子。优点:无需担心内存泄露问题;缺点:可能造成内存浪费,内存分配不灵活。

态内存分配允许你在运行时分配内存。你可以根据需要创建新的对象或释放不再需要的对象。 优点:灵活处理,按需分配;缺点:容易出现内存泄露和碎片化问题。

链接脚本的组成

链接脚本主要包含MEMORY和SECTIONS

MEMORY区块中,我们可以定义各种内存区域及其属性,如只读(ROM)或读写(RAM),或者FLASH等。我们还可以定义每个区域的大小和起始地址。

SECTIONS的定义及其内部段的详解 (.text, .data, .bss等)

  • .text:存放程序代码和常量数据。
  • .data:存放已初始化的全局和静态变量。
  • .bss:存放未初始化的全局和静态变量。

MEMORY的语法

MEMORY
{
name (attr) : ORIGIN = origin, LENGTH = len
...
}

name:一个用户定义的名字,Linker将在内部使用它,所以别把它和SECTIONS里用到的文件名,段名等搞重复了,它要求是独一无二的。

attr :如同它的名字一样,这是内存段的属性描述。

R' Read-only sections. W’ Read/write sections.
X' Sections containing executable code. A’ Allocated sections.
I' Initialized sections. L’ Same as I.
`!’ Invert the sense of any of the following attributes.

ORIGIN:这是起始地址

LENGTH:段长

SECTIONS的语法

SECTION> [ADDRESS] [(TYPE)] : [AT(LMA)]
{
OUTPUT-SECTION-COMMAND
OUTPUT-SECTION-COMMAND
...
} [>REGION] [AT>LMA_REGION] [:PHDR :PHDR...] [=FILLEXP]

其中:

SECTION 为输出段的名字定义

[ADDRESS]为输出段的VMA 虚拟地址

[(TYPE)] 为输出段的类型

[AT(LMA)] 为输出段的LMA 加载地址

[>REGION] 为输出段的VMA 地址依次累加

[AT>LMA_REGION]为输出段的LMA 地址依次累加

[:PHDR :PHDR…],[=FILLEXP] 很少用

OUTPUT-SECTION-COMMAND为输入段的模式匹配,定义那输入些段会被放到这个输出段中

需要注意的是**[ADDRESS]** 和 [AT(LMA)]必须指定具体的地址。[>region] 和 **[AT>LMA region]**只需指定MEMORY定义的内存空间,具体地址紧接着上一个output section的末尾地址。

另一种语法表示

SECTIONS
{
...
secname start BLOCK(align) (NOLOAD) : AT ( ldadr )
{ contents } >region :phdr =fill
...
}

这么多的参数中,只有secname和contents是必须的,其他都是可选的参数。 secname前后的两个空格是必须的,否则就是不合法输入。

secname:定义段,但是别以为定义的段一定要是教科书上写的.data,.text这些科班的必须品,你甚至可以创建一个段来放一个美女的图片。

contents:它的语法开始复杂起来了,但是你可以简单的把输入文件写到代码中:

.data : { main.o led.o}

但是结果被列的目标文件中所有的代码都被链接到.data中去了,显然不大符合我们的要求啊。那么还有一种写法:

.data : {
main.o(.data)
main.o(.text)// 也可以这样写 main.o(.data .text)或者main.o(.data , .text)
led.o(.data)
}

这个写法让只有被选中的文件的特殊段被链接到输出文件的.data段了。当然,我们似乎还有更好的写法:

.data : {
*.data)
}

这样的话,所有目标文件的.data段都被连接到了输出文件中了。

start:强制链接地址。 强迫链接器将当前的段连接到指定的地址中。

.data 0x400000000 : { … }

BLOCK(align): 用的时候用的比较多的是ALIGN(4)这样的标记,表示排列地址的时候按4的倍数排列

AT(addr):指定在文件中存放的位置

region: 这个region就是前面说的MEMORY命令定义的位置信息。

.表示当前地址

什么是当前的地址啊?就是链接器在连接的时候根据前面的段排列后的当前位置。

**RAM_START = .;**定义了一个RAM_START变量,地址是当前的地址

. = 0x00000000定义当前地址为0x0。

举例

链接文件
MEMORY
{
  FLASH (rx) : ORIGIN = 0x80000000, LENGTH = 8M 
  RAM (xrw)  : ORIGIN = 0x70000000, LENGTH = 1M   
}

这部分定义了芯片中的主要内存区域:FLASH 和 RAM。ORIGIN 指定了内存区域的起始地址,而 LENGTH 则定义了区域的大小。

SECTIONS
{
  .text :
  {
    KEEP(*(.isr_vector))
    *(.text*)
    *(.rodata*)
    _etext = .;
  } > FLASH

这里我们定义了 .text 段,其中包含程序的代码和只读数据。它被放置在 FLASH 内存中。 _etext 符号标记了该段的结束。

  .data :
  {
    _sdata = .;
    *(.data*)
    _edata = .;
  } > RAM AT> FLASH

.data 段存放初始化的全局和静态变量。它在 RAM 中创建但是其初始值存储在 FLASH 中。

  .bss :
  {
    _sbss = .;
    *(.bss*)
    _ebss = .;
  } > RAM

.bss 段存放未初始化的全局和静态变量。它只在 RAM 中创建,不占用任何 FLASH 空间。

  .stack :
  {
    . = ALIGN(8);
    _sstack = .;
    . += 0x1000;
    _estack = .;
  } > RAM

此部分定义了堆栈区域,其开始和结束由 _sstack_estack 标记。我们还确保它按8字节对齐,然后分配了0x1000字节的空间给它。

  .heap :
  {
    . = ALIGN(8);
    _sheap = .;
    . += 0x1000;
    _eheap = .;
  } > RAM
}

此部分定义了堆区域,其开始和结束由 _sheap_eheap 标记。和堆栈一样,它也被8字节对齐并分配了0x1000字节的空间。

C代码
extern uint32_t _sdata, _edata, _etext, _sbss, _ebss;

这行代码声明了在链接脚本中定义的符号,以便我们可以在 C 代码中引用它们。

void LowLevelInit(void) {
    uint32_t *pSrc, *pDest;

    // Initialize data section
    pSrc = &_etext;
    pDest = &_sdata;
    while (pDest < &_edata) {
        *pDest++ = *pSrc++;
    }

    // Clear the bss section
    pDest = &_sbss;
    while (pDest < &_ebss) {
        *pDest++ = 0;
    }
}

在 LowLevelInit 函数中,我们初始化 .data 段和清除 .bss 段。对于 .data 段,我们将其初始值从 FLASH 复制到 RAM。对于 .bss 段,我们将它设置为0。

int main(void) {
    LowLevelInit();

    // Now, you can call your AUTOSAR application startup code
    // ...

    return 0;
}

main 函数中,我们首先调用 LowLevelInit 来完成底层的初始化,然后再进行后续操作。

定义全局变量

int global_var = 42;       // Will be placed in the .data section
int uninit_global_var;     // Will be placed in the .bss section

内存管理

有了我们定义的堆区域,你可以实现和使用动态内存分配函数如 mallocfree。你可以使用 _sheap_eheap 符号来定义堆的边界。

extern uint32_t _sheap, _eheap;

void *malloc(size_t size) {
    // Implement a simple malloc function using _sheap and _eheap
    // ...
}

void free(void *ptr) {
    // Implement a simple free function
    // ...
}

可以使用 _sstack_estack_sheap, 和 _eheap 符号来监视或调试你的堆栈和堆使用情况。

在你的 C 代码中,你可以引用由链接脚本生成的各种符号来获取函数或数据的地址。例如:

extern uint32_t _etext;

void foo(void) {
    uint32_t func_address = (uint32_t)&foo;
    uint32_t etext_address = (uint32_t)&_etext;
    // ...
}

在这个例子中,我们获取了 foo 函数的地址和 _etext 符号的地址。

使用链接脚本

gcc -T linkerscript.ld -o my_app.elf my_app.c

在这个命令中,-T linkerscript.ld 指定了使用我们的链接脚本,-o my_app.elf 指定了输出文件的名字,my_app.c 是你的源代码文件。

实例

创建add.c文件,data.c 和main.c文件三个文件,并且写自己定义的链接脚本将这个三个.c文件链接为一个输出文件。

main.c
----------------
extern int add(int a , int b);
extern int data1;
extern int data2;
int main(void){
        add(data1,data2)
        return 0;
}

data.c
-----------------
int data1=10;
int data2=20;

add.c
-----------------
int add(int a , int b){
    return a+b;
}

使用arm gcc 生成每个.c对应的.o文件

arm-none-eabi-gcc -c main.c
arm-none-eabi-gcc -c data.c
arm-none-eabi-gcc -c add.c

使用objdump工具观察编译生成的*.o文件的内容,分别观察.text .data的Size, VMA(装载内存地址), LMA(虚拟内存地址)等。

arm-none-eabi-objdump -h main.o
arm-none-eabi-objdump -h data.o
arm-none-eabi-objdump -h add.o

更清晰地查看每个段的含义:

arm-none-eabi-objdump -s -d main.o > main.o.txt

查看反汇编信息main.o.txt

...
Disassembly of section .text:
00000000 <main>:
   0:   e92d4800        push    {fp, lr}
   ...
2c:   ebfffffe        bl      0 <add>
...

其中ebfffffe bl 0 <add>有一个标签<add>,bl目前跳转的地方是0地址,后期连接器应该是需要把这个值改回来的。

思考:现在有三个.o文件,分别是data.o add.o main.o 其中data.o放了两个全局变量的具体取值,add.o存放了使得两个整形数相加的函数实现,main.o则是使用了data.o的数据,add.o的函数。main.o在链接之前并不知道数据的具体数值,也不知道调用函数的函数位置,因此事先会把不知道的信息空出来,等到链接的时候再合并。因此接下来要观察链接的结果。

假设,我们目标的memorymap ,数据段存放在0x10000位置,代码段存放再0x80000的位置。

my.ld

SECTIONS { 
  . = 0x10000; 
  .text : {*(.text)}   
  . = 0x80000;   
  .data : {*(.data)}   
  .bss : {*(.bss)} 
}

使用连接器链接

arm-none-eabi-ld add.o data.o main.o -T my.ld -o out

得到输出文件out

反汇编out查看是否符合预期。

参考文献

ARM-GCC-LD脚本 - 知乎 (zhihu.com)

嵌入式软件之链接脚本 .ld - 知乎 (zhihu.com)

ld - 链接脚本学习笔记与实践过程 - 知乎 (zhihu.com)

链接脚本再探和VMA与LMA - Little_Village - 博客园 (cnblogs.com)

  • 40
    点赞
  • 45
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值