裸机上的 printf:在无操作系统环境下构建 C 标准库

在嵌入式开发和底层系统编程领域,裸机开发是一项极具挑战性但又至关重要的任务。想象一下,在没有操作系统支持的情况下,让 C 语言的标准库函数,如printf正常工作,这听起来是不是很有趣又充满挑战?今天,我们就来深入探索如何利用 Newlib 在裸机系统上实现这一目标,以 RISC-V 平台为例,揭开裸机编程的神秘面纱。

软件抽象与 C 标准库:从常规系统到裸机的转变

在日常使用的电脑系统,比如 Mac 或 Linux 笔记本上运行printf函数,背后有着一套复杂的机制。应用程序调用printf,这个函数通常是动态链接的,经过多层 C 函数调用后,最终会触发操作系统内核的系统调用。内核会通过不同的子系统来处理输出,涉及终端和伪终端的相关操作,最后将printf的输出呈现在屏幕上。而且,printf还要依据提供的模板对输出字符串进行格式化处理,这一整套流程涉及众多软件抽象层。

然而,裸机系统与常规系统大不相同。在裸机环境下,大多数这样的抽象层并不存在,软件栈要简单得多。在裸机上进行 C 编程时,C 函数下方没有任何支持。在常规系统中,进程可以通过系统调用(由软件中断实现)将输出交给内核处理,但在裸机上没有内核可交付,可我们仍希望printf之类的函数能够工作,最好是能输出到像通用异步收发传输器(UART)这样的简单 I/O 设备上。这时候,Newlib 就发挥作用了。

Newlib:裸机 C 标准库的构建利器

你或许熟悉 GNU 的glibcmusl等 C 标准库,但如果想在裸机上启用 C 标准库,Newlib 绝对值得关注。从本质上讲,Newlib 并不是一个完整的 C 标准库,而是一个构建定制、精简 C 标准库的工具包。

Newlib 将 C 标准库的实现简化为几个具有清晰接口的基本原语,这些原语可以作为独立函数来实现。像printfmalloc这样更复杂的函数会调用这些原语。例如,我们需要实现_write原语,它的作用是向输出流写入单个字符,Newlib 会在这个基础上构建printf函数,从而实现更复杂的输出功能。

此外,Newlib 还提供了一些预制的实现。在某些配置下,你甚至可以将底层平台指定为 Linux,这时 Newlib 提供的实现会像glibc一样进行系统调用。而在极简配置中,Newlib 会以最小化的形式提供所有原语,这些原语要么返回零,要么抛出错误。开发者可以根据应用程序的实际需求,选择实现自己关心的构建模块,其余部分则依赖默认实现。

交叉编译工具链:连接不同平台的桥梁

在深入了解如何使用 Newlib 之前,我们需要先掌握交叉编译工具链的概念。交叉编译是指在一个平台上编译代码,生成另一个平台可执行的指令。例如,从 x86_64/Linux 平台编译代码,使其能在 ARM64/Mac 上运行。

在 Linux 平台下,情况更为复杂,因为不同的 Linux 发行版可能使用不同的 C 标准库。从使用一种标准库的平台编译到使用另一种标准库的同一架构平台,也属于交叉编译。比如,从 x86_64/Linux/glibc 平台编译到 x86_64/Linux/musl 平台。甚至从一个版本的glibc编译到另一个版本,同样属于交叉编译,像从 x86_64/Linux/glibc_v1.0 编译到 x86_64/Linux/glibc_v1.1。

传统的构建和使用编译器的方式,比如使用 GCC,在处理交叉编译时可能会变得很复杂。不过,我们可以采用一种更便捷的方法来满足需求。我们需要一个满足特定要求的工具链:能从主机平台生成 RISC-V 指令,并且在调用 C 标准库功能时使用 Newlib 库。

在典型的 Linux 发行版中,安装的 GCC 或 clang 默认会为运行它的同一平台进行编译,即宿主平台和目标平台相同,这被称为本地编译。当包含<stdio.h>头文件并调用printf函数时,编译器会从标准位置查找相关文件和实现。例如,在 Debian 系统中,stdio.h位于/usr/include目录,标准 C 库glibc的动态链接版本位于/lib/x86_64-linux-gnu/libc.so(实际指向/lib/x86_64-linux-gnu/libc.so.6 )。

为了进行交叉编译,我们需要获取能为目标平台生成指令的编译器,为目标平台设置 C 标准库的路径,并确保目标平台的编译器知道如何使用该库。这一系列操作通常较为繁琐,不过我们可以借助一些自动化工具来简化流程。

自动化 RISC-V 工具链构建

为了简化在 RISC-V 平台上使用 Newlib 进行开发的过程,我们可以使用 RISC-V 工具链项目。该项目虽然仍需在主机上从源代码构建所有内容,但会通过脚本自动化处理繁琐的编排工作,包括编译器的搭建。

首先,从 GitHub 克隆相关仓库。需要注意的是,克隆时最好使用--recursive标志,以避免后续问题,尽管官方说明该标志不是必需的,但在某些系统上不使用可能会出现问题。克隆过程可能会花费较长时间,因为要下载大量源代码。

克隆完成后,进行配置。例如:./configure --prefix=/opt/riscv-newlib --enable-multilib --disable-gdb --with-cmodel=medany。这里的prefix指定了新构建的工具链、C 标准库(这里是 Newlib)等的安装路径;enable-multilib用于启用针对不同 RISC-V 配置的构建,但会使构建过程变慢;disable-gdb是因为构建 GDB 时可能会出现问题,所以将其排除在工具链之外;with-cmodel=medany这个参数稍后会详细解释,它对 64 位 RISC-V 构建的正常运行很关键。

配置完成后,通过make命令启动构建过程。这里有个小提示,不要尝试使用-j16等参数进行并行构建,可能会导致构建失败。构建过程会持续较长时间,期间可以做些其他事情。构建完成后,会在指定的prefix路径下生成可执行文件、库文件等。

实现内存和 UART 构建模块

在拥有了可用的 RISC-V + Newlib 交叉工具链后,就可以开始构建 Newlib 的基础模块了。先从 UART 相关的代码入手,创建uart.h文件:

#ifndef UART_H
#define UART_H

void uart_putc(char c);
char uart_getc(void);

#endif

接着实现这两个函数,在这个示例中,针对 QEMU 的 16550A UART 进行操作:

#include "uart.h"
// QEMU UART寄存器地址
#define UART_BASE 0x10000000
#define UART_THR  (*(volatile char *)(UART_BASE + 0x00))
#define UART_RBR  (*(volatile char *)(UART_BASE + 0x00))
#define UART_LSR  (*(volatile char *)(UART_BASE + 0x05))
#define UART_LSR_TX_IDLE  (1 << 5)
#define UART_LSR_RX_READY (1 << 0)

void uart_putc(char c) {
    // 等待发送器空闲
    while ((UART_LSR & UART_LSR_TX_IDLE) == 0);
    UART_THR = c;
    // 特殊处理换行符,发送CR+LF
    if (c == '\n') {
        while ((UART_LSR & UART_LSR_TX_IDLE) == 0);
        UART_THR = '\r';
    }
}

char uart_getc(void) {
    // 等待数据
    while ((UART_LSR & UART_LSR_RX_READY) == 0);
    return UART_RBR;
}

接下来是syscalls.c文件,实现printf等函数依赖的原语,同时处理输入操作:

// 省略部分代码...

void* _sbrk(int incr) {
    extern char _end;         // 由链接器定义,静态段结束标志
    extern char _stack_bottom; // 链接器脚本中定义,栈底地址
    static char *heap_end = &_end;
    char *prev_heap_end = heap_end;

    // 计算安全的栈限制,栈从_stack_top向下增长到_stack_bottom
    char *stack_limit = &_stack_bottom;
    // 检查堆是否会增长到太靠近栈的位置
    if (heap_end + incr > stack_limit) {
        errno = ENOMEM;
        return (void*) -1; // 返回错误
    }
    heap_end += incr;
    return (void*) prev_heap_end;
}

应用示例:输入与输出

现在来构建一个裸机应用示例。编写main.c文件:

#include <stdio.h>

int main(void) {
    printf("Hello from RISC-V UART!\n");
    char buffer[100];
    printf("Type something: ");
    scanf("%s", buffer);
    printf("You typed: %s\n", buffer);
    while (1) {}
    return 0;
}

这个应用会通过 UART 输出问候语,提示用户输入内容,读取用户输入并再次输出。由于没有运行在常规的 Shell 环境中,输入时不会回显按键内容。

还需要一个简单的 C 运行时文件startup.S

.section .text.init
.global _start
_start:
    la sp, _stack_top
    # 清空BSS段,使用链接器脚本中定义的符号
    la t0, _bss_start
    la t1, _bss_end
clear_bss:
    bgeu t0, t1, bss_done
    sb zero, 0(t0)
    addi t0, t0, 1
    j clear_bss
bss_done:
    # 跳转到C代码
    call main
    # 如果main函数返回,进入无限循环
    j .

最后是链接器脚本link.ld

OUTPUT_FORMAT("elf64-littleriscv")
OUTPUT_ARCH("riscv")
ENTRY(_start)

MEMORY {
    RAM (rwx) : ORIGIN = 0x80000000, LENGTH = 64M
}

SECTIONS {
    /* 代码段 */
   .text : {
        *(.text.init)
        *(.text)
    } > RAM
    /* 只读数据段 */
   .rodata : {
        *(.rodata)
    } > RAM
    /* 已初始化数据段 */
   .data : {
        *(.data)
    } > RAM
    /* 小的已初始化数据段 */
   .sdata : {
        *(.sdata)
    } > RAM
    /* BSS段,有明确符号 */
   .bss : {
        _bss_start =.;  /* 定义BSS段开始符号 */
        *(.bss)
        *(COMMON)
       .= ALIGN(8);
        _bss_end =.;    /* 定义BSS段结束符号 */
    } > RAM
    /* 小BSS段 */
   .sbss : {
        _sbss_start =.;
        *(.sbss)
        *(.sbss.*)
       .= ALIGN(8);
        _sbss_end =.;
    } > RAM
    /* 堆起始标记 */
   .= ALIGN(8);
    _end =.; /* 堆从这里开始向上增长 */
    /* 栈从RAM末尾向下增长 */
    _stack_size = 64K;
    _stack_top = ORIGIN(RAM) + LENGTH(RAM);
    _stack_bottom = _stack_top - _stack_size;
    /* 确保堆和栈不重叠 */
    ASSERT(_end <= _stack_bottom, "Error: Heap collides with stack")
}

链接器脚本负责安排代码和数据在内存中的位置,确保各个段正确放置,并且堆和栈不会冲突。

关键要点与应用运行

在构建工具链时,--with-cmodel=medany这个参数至关重要。由于我们构建的是 64 位 RISC-V 机器代码,应用程序代码需要使用能够处理高地址的内存地址模型。如果没有这个参数,Newlib 库可能会使用无法有效处理高地址的 RISC-V 指令,导致链接错误。

在 GitHub 仓库中提供了Makefile来简化构建和运行过程。运行make debug命令,它会调用交叉编译器编译代码,并使用 QEMU 进行仿真。Makefile中的CFLAGS包含-specs=nosys.specs,这会让工具链使用 Newlib 的nosys版本,该版本所有构建模块默认是存根,返回零或错误。链接器标志-nostartfiles表示我们将提供自己的最小 C 运行时。

运行make debug后,QEMU 启动,输入内容并回车,就能看到应用的输出。同时,debug目标会生成一个qemu_debug.log文件,它记录了 VM 的完整运行轨迹,有助于深入了解printf等函数的工作原理以及 RISC-V 核心的执行过程。

总结

通过这个示例,我们成功地在裸机平台上实现了printf等 C 标准库函数的功能,让裸机编程有了更接近在完整内核上编程的体验。利用 Newlib 定义的构建模块,我们可以进一步扩展功能,实现文件访问、更完善的内存管理等。而且,这为在裸机代码中使用强大的库提供了可能。尽管在极简环境下,最终软件镜像的大小和指令数量需要考虑,但我们构建的ELF文件大小为220K,还算比较合理。希望这篇文章能为你的开发工作提供新的思路和方法,祝大家在裸机编程的世界中探索愉快!

科技脉搏,每日跳动。

与敖行客 Allthinker一起,创造属于开发者的多彩世界。

图片

- 智慧链接 思想协作 -

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值