ARM-GCC-LD脚本入门讲解

最新推荐文章于 2024-06-05 10:47:26 发布

孤独的思索者

最新推荐文章于 2024-06-05 10:47:26 发布

阅读量2k

点赞数 40

文章标签： arm开发

本文链接：https://blog.csdn.net/qq_43742107/article/details/136569540

版权

基础

什么是链接脚本

链接脚本是由链接器使用的文件，用于控制程序的内存布局，指定代码和数据在内存中的位置。

链接脚本可以确保代码和数据被放置在正确的位置，避免冲突和溢出问题。

编译、汇编和链接的基本概念

编译：将源代码（如C或C++）转换为汇编语言。
汇编：将汇编语言转换为机器代码。
链接：将多个对象文件和库合并成一个单一的可执行文件。

各种内存区域 (RAM, ROM, Stack, Heap)

RAM：用于存储变量和程序数据。
ROM：用于存储程序代码和常量数据。
Stack：用于存储局部变量和函数调用的返回地址。
Heap：用于动态内存分配。

内存分配策略

两种主要的内存分配策略: 静态内存分配和动态内存分配

静态内存分配是在编译时进行的，它的大小和位置在程序运行期间是不变的。全局变量和局部静态变量是静态内存分配的例子。优点：无需担心内存泄露问题；缺点：可能造成内存浪费，内存分配不灵活。

态内存分配允许你在运行时分配内存。你可以根据需要创建新的对象或释放不再需要的对象。优点：灵活处理，按需分配；缺点：容易出现内存泄露和碎片化问题。

链接脚本的组成

链接脚本主要包含MEMORY和SECTIONS

在MEMORY区块中，我们可以定义各种内存区域及其属性，如只读(ROM)或读写(RAM)，或者FLASH等。我们还可以定义每个区域的大小和起始地址。

SECTIONS的定义及其内部段的详解 (.text, .data, .bss等)

.text：存放程序代码和常量数据。
.data：存放已初始化的全局和静态变量。
.bss：存放未初始化的全局和静态变量。

MEMORY的语法

MEMORY
{
name (attr) : ORIGIN = origin, LENGTH = len
...
}

name：一个用户定义的名字，Linker将在内部使用它，所以别把它和SECTIONS里用到的文件名，段名等搞重复了，它要求是独一无二的。

attr ：如同它的名字一样，这是内存段的属性描述。

R' Read-only sections. W’ Read/write sections.
X' Sections containing executable code. A’ Allocated sections.
I' Initialized sections. L’ Same as I.
`!’ Invert the sense of any of the following attributes.

ORIGIN：这是起始地址

LENGTH：段长

SECTIONS的语法

SECTION> [ADDRESS] [(TYPE)] : [AT(LMA)]
{
OUTPUT-SECTION-COMMAND
OUTPUT-SECTION-COMMAND
...
} [>REGION] [AT>LMA_REGION] [:PHDR :PHDR...] [=FILLEXP]

其中：

SECTION 为输出段的名字定义

[ADDRESS]为输出段的VMA 虚拟地址

[(TYPE)] 为输出段的类型

[AT(LMA)] 为输出段的LMA 加载地址

[>REGION] 为输出段的VMA 地址依次累加

[AT>LMA_REGION]为输出段的LMA 地址依次累加

[:PHDR :PHDR…]，[=FILLEXP] 很少用

OUTPUT-SECTION-COMMAND为输入段的模式匹配，定义那输入些段会被放到这个输出段中

需要注意的是**[ADDRESS]** 和 [AT(LMA)]必须指定具体的地址。[>region] 和 **[AT>LMA region]**只需指定MEMORY定义的内存空间，具体地址紧接着上一个output section的末尾地址。

另一种语法表示

SECTIONS
{
...
secname start BLOCK(align) (NOLOAD) : AT ( ldadr )
{ contents } >region :phdr =fill
...
}

这么多的参数中，只有secname和contents是必须的，其他都是可选的参数。 secname前后的两个空格是必须的，否则就是不合法输入。

secname：定义段，但是别以为定义的段一定要是教科书上写的.data，.text这些科班的必须品，你甚至可以创建一个段来放一个美女的图片。

contents：它的语法开始复杂起来了，但是你可以简单的把输入文件写到代码中：

.data : { main.o led.o}

但是结果被列的目标文件中所有的代码都被链接到.data中去了，显然不大符合我们的要求啊。那么还有一种写法：

.data : {
main.o（.data）
main.o（.text）// 也可以这样写 main.o(.data .text)或者main.o(.data , .text)
led.o（.data）
}

这个写法让只有被选中的文件的特殊段被链接到输出文件的.data段了。当然，我们似乎还有更好的写法：

.data : {
*（.data）
}

这样的话，所有目标文件的.data段都被连接到了输出文件中了。

start：强制链接地址。强迫链接器将当前的段连接到指定的地址中。

.data 0x400000000 : { … }

BLOCK(align)：用的时候用的比较多的是ALIGN（4）这样的标记，表示排列地址的时候按4的倍数排列

AT（addr）：指定在文件中存放的位置

region：这个region就是前面说的MEMORY命令定义的位置信息。

.表示当前地址

什么是当前的地址啊？就是链接器在连接的时候根据前面的段排列后的当前位置。

**RAM_START = .;**定义了一个RAM_START变量，地址是当前的地址

. = 0x00000000定义当前地址为0x0。

举例

链接文件

MEMORY
{
  FLASH (rx) : ORIGIN = 0x80000000, LENGTH = 8M 
  RAM (xrw)  : ORIGIN = 0x70000000, LENGTH = 1M   
}

这部分定义了芯片中的主要内存区域：FLASH 和 RAM。ORIGIN 指定了内存区域的起始地址，而 LENGTH 则定义了区域的大小。

SECTIONS
{
  .text :
  {
    KEEP(*(.isr_vector))
    *(.text*)
    *(.rodata*)
    _etext = .;
  } > FLASH

这里我们定义了 .text 段，其中包含程序的代码和只读数据。它被放置在 FLASH 内存中。 _etext 符号标记了该段的结束。

  .data :
  {
    _sdata = .;
    *(.data*)
    _edata = .;
  } > RAM AT> FLASH

.data 段存放初始化的全局和静态变量。它在 RAM 中创建但是其初始值存储在 FLASH 中。

  .bss :
  {
    _sbss = .;
    *(.bss*)
    _ebss = .;
  } > RAM

.bss 段存放未初始化的全局和静态变量。它只在 RAM 中创建，不占用任何 FLASH 空间。

  .stack :
  {
    . = ALIGN(8);
    _sstack = .;
    . += 0x1000;
    _estack = .;
  } > RAM

此部分定义了堆栈区域，其开始和结束由 _sstack 和 _estack 标记。我们还确保它按8字节对齐，然后分配了0x1000字节的空间给它。

  .heap :
  {
    . = ALIGN(8);
    _sheap = .;
    . += 0x1000;
    _eheap = .;
  } > RAM
}

此部分定义了堆区域，其开始和结束由 _sheap 和 _eheap 标记。和堆栈一样，它也被8字节对齐并分配了0x1000字节的空间。

C代码

extern uint32_t _sdata, _edata, _etext, _sbss, _ebss;

这行代码声明了在链接脚本中定义的符号，以便我们可以在 C 代码中引用它们。

void LowLevelInit(void) {
    uint32_t *pSrc, *pDest;

    // Initialize data section
    pSrc = &_etext;
    pDest = &_sdata;
    while (pDest < &_edata) {
        *pDest++ = *pSrc++;
    }

    // Clear the bss section
    pDest = &_sbss;
    while (pDest < &_ebss) {
        *pDest++ = 0;
    }
}

在 LowLevelInit 函数中，我们初始化 .data 段和清除 .bss 段。对于 .data 段，我们将其初始值从 FLASH 复制到 RAM。对于 .bss 段，我们将它设置为0。

int main(void) {
    LowLevelInit();

    // Now, you can call your AUTOSAR application startup code
    // ...

    return 0;
}

在 main 函数中，我们首先调用 LowLevelInit 来完成底层的初始化,然后再进行后续操作。

定义全局变量

int global_var = 42;       // Will be placed in the .data section
int uninit_global_var;     // Will be placed in the .bss section

内存管理

有了我们定义的堆区域，你可以实现和使用动态内存分配函数如 malloc 和 free。你可以使用 _sheap 和 _eheap 符号来定义堆的边界。

extern uint32_t _sheap, _eheap;

void *malloc(size_t size) {
    // Implement a simple malloc function using _sheap and _eheap
    // ...
}

void free(void *ptr) {
    // Implement a simple free function
    // ...
}

可以使用 _sstack, _estack, _sheap, 和 _eheap 符号来监视或调试你的堆栈和堆使用情况。

在你的 C 代码中，你可以引用由链接脚本生成的各种符号来获取函数或数据的地址。例如：

extern uint32_t _etext;

void foo(void) {
    uint32_t func_address = (uint32_t)&foo;
    uint32_t etext_address = (uint32_t)&_etext;
    // ...
}

在这个例子中，我们获取了 foo 函数的地址和 _etext 符号的地址。

使用链接脚本

gcc -T linkerscript.ld -o my_app.elf my_app.c

在这个命令中，-T linkerscript.ld 指定了使用我们的链接脚本，-o my_app.elf 指定了输出文件的名字，my_app.c 是你的源代码文件。

实例

创建add.c文件，data.c 和main.c文件三个文件，并且写自己定义的链接脚本将这个三个.c文件链接为一个输出文件。

main.c
----------------
extern int add(int a , int b);
extern int data1;
extern int data2;
int main(void){
        add(data1,data2)
        return 0;
}

data.c
-----------------
int data1=10;
int data2=20;

add.c
-----------------
int add(int a , int b){
    return a+b;
}

使用arm gcc 生成每个.c对应的.o文件

arm-none-eabi-gcc -c main.c
arm-none-eabi-gcc -c data.c
arm-none-eabi-gcc -c add.c

使用objdump工具观察编译生成的*.o文件的内容，分别观察.text .data的Size, VMA(装载内存地址), LMA(虚拟内存地址)等。

arm-none-eabi-objdump -h main.o
arm-none-eabi-objdump -h data.o
arm-none-eabi-objdump -h add.o

更清晰地查看每个段的含义：

arm-none-eabi-objdump -s -d main.o > main.o.txt

查看反汇编信息main.o.txt

...
Disassembly of section .text:
00000000 <main>:
   0:   e92d4800        push    {fp, lr}
   ...
2c:   ebfffffe        bl      0 <add>
...

其中ebfffffe bl 0 <add>有一个标签<add>,bl目前跳转的地方是0地址，后期连接器应该是需要把这个值改回来的。

思考：现在有三个.o文件，分别是data.o add.o main.o 其中data.o放了两个全局变量的具体取值，add.o存放了使得两个整形数相加的函数实现，main.o则是使用了data.o的数据，add.o的函数。main.o在链接之前并不知道数据的具体数值，也不知道调用函数的函数位置，因此事先会把不知道的信息空出来，等到链接的时候再合并。因此接下来要观察链接的结果。

假设，我们目标的memorymap ，数据段存放在0x10000位置，代码段存放再0x80000的位置。

my.ld

SECTIONS { 
  . = 0x10000; 
  .text : {*(.text)}   
  . = 0x80000;   
  .data : {*(.data)}   
  .bss : {*(.bss)} 
}

使用连接器链接

arm-none-eabi-ld add.o data.o main.o -T my.ld -o out

得到输出文件out

反汇编out查看是否符合预期。

参考文献

ARM-GCC-LD脚本 - 知乎 (zhihu.com)

嵌入式软件之链接脚本 .ld - 知乎 (zhihu.com)

ld - 链接脚本学习笔记与实践过程 - 知乎 (zhihu.com)

链接脚本再探和VMA与LMA - Little_Village - 博客园 (cnblogs.com)

孤独的思索者

关注

40
点赞
踩
45

收藏

觉得还不错? 一键收藏
1
评论
ARM-GCC-LD脚本入门讲解

ARM嵌入式开发中，链接脚本.ld的编写和使用，通过整合多篇文章加上自己的见解而编写，尽可能地全面，方便对ARM嵌入式项目中的链接脚本地阅读查阅。
复制链接

扫一扫