STM32启动文件学习总结
1.概述
1.1学习目的
初次学习STM32,在学习的过程思考了一个问题,那就是STM32以嵌入式C为主,因此main函数就自然而然的成了程序运行的起点。那么问题来了,为什么单片机上电后,就一定是从mian函数开始执行的呢?它是如何寻址的呢?回想我们曾经学过的STC89C51还是现在学的STM32在学习编写代码的时候都是习惯性的从mian函数开始的,却忽略了这个问题。带着疑问,我很快就寻找到了答案:启动文件,英文的描述是“bootloader”。
1.2.学习过程
接下来我将从以下几个方面介绍我学习和解答的过程
1、启动模式
2、流程图
3、程序在Flash上的存储结构
4、数据在SRAM上的结构
5、启动过程
6、.s文件分析
7、总结
1.3参考文档
《STM32L496xx数据手册》
《RM0351参考手册》
《AN4726应用说明》
2、启动模式
STM32的芯片自带的启动模式有三种,通过BOOT1、BOOT0的高低电平控制其模式的选择。
启动模式选择 | 启动模式 | 说明 | |
BOOT1 | BOOT0 | ||
x | 0 | Flash存储器 | Flash存储器作为启动区域 |
0 | 1 | 系统存储器 | 系统存储器作为启动区域 |
1 | 1 | 内置SRAM1 | 内置SRAM1作为启动区域 |
启动时,BOOT0引脚和nBOOT1选项位用于选择三个引导选项之一:
- 从Flash存储器启动
- 从系统存储器启动
- 从内置SRAM1启动
BOOT0值可能来自PH3-BOOT0引脚或一个选项位,具体取决于用户选项位的值以在需要时释放GPIO。
如果执行以下操作,则会实施Flash空检查机制来强制从系统闪存启动:
第一个闪存位置未编程,并且引导选择是否配置为引导从主闪光灯。
启动位于系统内存中的加载程序。 用于通过以下方式对闪存进行重新编程:
通过DFU(设备)在设备模式下使用USART,I2C,SPI,CAN或USB OTG FS固件升级)。
- 启动过程流程图
硬件初始化,设置SP、PC:上电后,自动从0x08000000位置读取数据赋予给栈指针SP,然后自动从0x08000004位置读取数据赋予给PC,完成复位。
设置系统时钟:执行Systeminit函数,完成对系统时钟的初始化。
软件设置SP: LDR R0,=_mian
RX RO
加载.date .bss,并初始化栈区下一节的程序在Flash的存储结构可以清晰的体现
跳转到.c文件的main函数
- 程序在Flash上的存储结构
程序下载Flash上后的Flash的存储结构:
MSP初始值 编译器生成,主堆栈的初始值
异常向量表
外部中断向量表
代码段 存放代码
初始化数据段 .data
未初始化数据段 .bss
加载数据段和初始化栈的参数
加载数据段和初始化栈的参数分别有4个,加载数据段的参数如下:
0x0800 033c Flash上的数据段(初始化数据段和未初始化数据段)起始地址
0x2000 0000 加载到SRAM上的目的地址
0x0000 000c 数据段的总大小
0x0800 02f4 调用函数_scatterload_copy
需要说明的是初始化栈的函数--0x0800 0304与加载数据段的函数不一样,为_scatterload_zeroinit,它的目的就是将栈空间清零,但不同新芯片设置的初始化参数也有不同,所以需要注意。
根据芯片的不同,Flash的大小不同,因此相应的结构也不同,地址分配也不同,详细了解可以看参考手册,里面举例了1MFlash的存储结构、512KB的存储结构、256KB的存储结构,拿1MFlash看有趣的是其main memory区域分了2个,分别是Bank1,Bank2,空间分配各是512KB,地址分配是从0x08000000~0x0807FFFF,0x08080000~0x080FFFFF,而在其Bank1、Bank2的信息块中却分别包含着28KB的system memory。
由流程图我们可以了解到程序在下载到Flash上的存储结构时怎样的。同时如果STM32被设置为从内部FLASH启动中断,向量表起始地位为0x08000000,则栈顶地址存放于0x08000000处,而复位中断服务入口地址存放于0x8000004处。当STM32遇到复位信号后,则从0x80000004处取出复位中断服务入口地址,继而执行复位中断服务程序,然后跳转__main函数,最后进入main函数。
5、数据在SRAM上的结构
程序运行时(执行到main函数)时的SRAM数据结构:
我现在所用的开发板STM32L496ZG具有高达320 KB的SRAM,其中有256 KB SRAM1和64 KB SRAM2。这些SRAM可以字节,半字(16位)或全字(32位)的形式访问。这些可以以最大系统时钟频率寻址存储器,而无需等待状态和因此由CPU和DMA共同完成。CPU可以通过系统总线或ICode / DCode访问SRAM1。选择从SRAM1启动或选择物理重映射时总线。 为了在执行SRAM1时获得最大性能,物理重映射应被选中(引导或软件选择)。可以从SRAM2以最高性能执行,而无需任何物理重映射通过ICode总线的访问。器件上SRAM2的别名地址为0x2004 0000,提供了一个SRAM1的连续地址空间。
6、启动过程分析
6.1、硬件初始化,设置SP、PS
刚上电复位后,硬件会自动根据向量表偏移地址找到向量表,向量表偏移地址的定义如下:
向量表偏移量寄存器(VTOR)地址 | ||||
位段 | 名称 | 类型 | 复位值 | 描述 |
7-28 | TBLOFF | RW | 0 | 向量表的起始地址 |
29 | TBLBASE | R | - | 向量表是在Code区(0),还是在RAM区(1) |
硬件这时自动从0x0800 0000位置处读取数据赋给栈指针SP,然后自动从0x0800 0004位置处读取数据赋给PC,完成复位。
6.2、设置系统时钟
在复位子程序中除了需要完成后面会提到的重要的一步跳转到C文件的main函数外,还有一步操作也是很关键的,那就是调用Systeminit函数对系统时钟初始化。
6.3、软件设置SP
LDR R0,=__main
BX R0
执行上两条之类,跳转到__main程序段运行,注意不是main函数.
6.4、加载.data、.bss,并初始化栈区
BL.W __scatterload_rt2 ;进入 __scatterload_rt2代码段
这段代码是个循环(BCC 0x0800016e),实际运行时候循环了两次。第一次运行的时候,读取“加载数据段的函数(_scatterload_copy)”的地址并跳转到该函数处运行(注意加载已初始化数据段和未初始化数据段用的是同一个函数);第二次运行的时候,读取“初始化栈的函数(_scatterload_zeroinit)”的地址并跳转到该函数处运行。
当然执行这两个函数的时候,还需要传入参数。至于参数。当这两个函数都执行完后,结果就是“数据在SRAM上的结构”所展示的图。
6.5跳转到C文件的main函数
在复位子程序是硬件上电后执行的第一个程序中,运用上面命令直接调用c里面的main函数。
7、.s文件分析
7.1 栈区初始化
开辟栈的大小为 0X00000400(1KB),名字为 STACK, NOINIT 即不初始化,可读可写, 8(2^3)字节对齐。
栈的作用是用于局部变量,函数调用,函数形参等的开销,栈的大小不能超过内部SRAM 的大小。如果编写的程序比较大,定义的局部变量很多,那么就需要修改栈的大小。如果某一天,你写的程序出现了莫名奇怪的错误,并进入了硬 fault 的时候,这时你就要考虑下是不是栈不够大,溢出了。
EQU:宏定义的伪指令,相当于等于,类似与 C 中的 define。
AREA:告诉汇编器汇编一个新的代码段或者数据段。 STACK 表示段名,这个可以任意命名; NOINIT 表示不初始化; READWRITE 表示可读可写, ALIGN=3,表示按照 2^3对齐,即 8 字节对齐。
SPACE:用于分配一定大小的内存空间,单位为字节。这里指定大小等于 Stack_Size。
标号__initial_sp 紧挨着 SPACE 语句放置,表示栈的结束地址,即栈顶地址,栈是由高向低生长的。
7.2 堆区初始化
开辟堆的大小为 0X00000200(512 字节),名字为 HEAP, NOINIT 即不初始化,可读可写, 8(2^3)字节对齐。 __heap_base 表示对的起始地址, __heap_limit 表示堆的结束地址。堆是由低向高生长的,跟栈的生长方向相反。
堆主要用来动态内存的分配,像 malloc()函数申请的内存就在堆上面。这个在 STM32里面用的比较少。
PRESERVE8: 指定当前文件的堆栈按照 8 字节对齐。
THUMB:表示后面指令兼容 THUMB 指令。 THUBM 是 ARM 以前的指令集, 16bit,现在 Cortex-M 系列的都使用 THUMB-2 指令集, THUMB-2 是 32 位的,兼容 16 位和 32 位的指令,是 THUMB 的超集。
7.3 向量表
定义一个数据段,名字为 RESET,可读。并声明 __Vectors、 __Vectors_End 和__Vectors_Size 这三个标号具有全局属性,可供外部的文件调用。
EXPORT: 声明一个标号可被外部的文件使用,使标号具有全局属性。如果是 IAR 编译器,则使用的是 GLOBAL 这个指令。
当内核响应了一个发生的异常后,对应的异常服务例程(ESR)就会执行。为了决定 ESR的入口地址, 内核使用了―向量表查表机制‖。这里使用一张向量表。向量表其实是一个WORD(32 位整数)数组,每个下标对应一种异常,该下标元素的值则是该 ESR 的入口地址。向量表在地址空间中的位置是可以设置的,通过 NVIC 中的一个重定位寄存器来指出向量表的地址。在复位后,该寄存器的值为 0。因此,在地址 0 (即 FLASH 地址 0) 处必须包含一张向量表,用于初始时的异常分配。要注意的是这里有个另类: 0 号类型并不是什么入口地址,而是给出了复位后 MSP 的初值。
表格:F103 向量表
__Vectors 为向量表起始地址, __Vectors_End 为向量表结束地址,两个相减即可算出向量表大小。
向量表从 FLASH 的 0 地址开始放置,以 4 个字节为一个单位,地址 0 存放的是栈顶地址, 0X04 存放的是复位程序的地址,以此类推。从代码上看,向量表中存放的都是中断服务函数的函数名,可我们知道 C 语言中的函数名就是一个地址。
DCD:分配一个或者多个以字为单位的内存,以四字节对齐,并要求初始化这些内存。在向量表中, DCD 分配了一堆内存,并且以 ESR 的入口地址初始化它们。
当内核响应了一个发生的异常后,对应的异常服务例程(ESR)就会执行。为了决定 ESR 的入口地址,它会使用了“向量表查表机制”。这里使用一张向量表。向量表其实是一个 WORD(32位整数)数组,每个下标对应一种异常,该下标元素的值则是该 ESR 的入口地址。向量表在地址空间中的位置是可以设置的,通过NVIC中的一个重定位寄存器来指出向量表的地址。在复位后,该寄存器的值为0。因此,在地址 0 处必须包含一张向量表,用于初始时的异常分配。
异常类型 | 表项地址 | 异常向量 |
0 | 0x00 | MSP初始值 |
1 | 0x04 | 复位 |
2 | 0x08 | NMI |
3 | 0x0c | 硬Fualt |
4 | 0x10 | MenMange fualt |
5 | 0x14 | 总线Fault |
6 | 0x14 | 用法Fault |
7-10 | 0x18 | 保留 |
11 | 0x1C-0x28 | SVC |
12 | 0x2C | 调试监控器 |
13 | 0x30 | 保留 |
14 | 0x34 | PendSV |
15 | 0x38 | SysTick |
16 | 0x40 | IRQ#0 |
17 | 0x44 | IRQ#1 |
18-255 | 0x48-0x3FF | IRQ#2-#239 |
举个例子,如果发生了异常 11(SVC),则 NVIC 会计算出偏移移量是 11x4=0x2C,然后从那里 取出服务例程的入口地址并跳入。需要注意的是这里有个另类:0号类型并不是什么入口地址,而是给出了复位后 MSP的初值。
7.4 复位程序
定义一个名称为.text 的代码段,可读。
复位子程序是系统上电后第一个执行的程序,调用SystemInit函数初始化系统时钟,然后调用C/C++标准库函数_mian,最终调用main函数去到C程序中 。
WEAK:表示弱定义,如果外部文件优先定义了该标号则首先引用该标号,如果外部文件没有声明也不会出错。这里表示复位子程序可以由用户在其他文件重新实现,这里并不是唯一的。
IMPORT:表示该标号来自外部文件,跟 C 语言中的EXTERN关键字类似。这里表示 SystemInit和__main这两个函数均来自外部的文件。
SystemInit()是一个标准的库函数,在system_stm32f10x.c这个库文件总定义。主要作用是配置系统时钟,这里调用这个函数之后,单片机的系统时钟配被配置为 72M。__main是一个标准的 C 库函数,主要作用是初始化用户堆栈,并在函数的最后调的 main函数去到C库中。这就是为什么我们写的程序都有一个main函数的原因。
LDR、BLX、BX是CM4内核的指令,根据指令集里面查询到,具体作用见下表:
指令名称 | 作用 |
LDR | 从存储器中加载字到一个寄存器中 |
BL | 跳转到由寄存器/标号给出的地址,并把跳转前的下一条指令地址保存到LR |
BLX | 跳转到由寄存器给出的地址,并根据寄存器的LSE确定处理器的状态。还要把跳到前的下一条指令地址保存到LR |
BX | 跳转到由寄存器/标号给出的地址,不返回 |
7.5 中断服务程序
在启动文件里面已经帮我们写好所有中断的中断服务函数,跟我们平时写的中断服务函数不一样的就是这些函数都是空的,真正的中断复服务程序需要我们在外部的 C 文件里面重新实现,这里只是提前占了一个位置而已。
如果我们在使用某个外设的时候,开启了某个中断,但是又忘记编写配套的中断服务程序或者函数名写错,那当中断来临的时,程序就会跳转到启动文件预先写好的空的中断服务程序中,并且在这个空函数中无线循环,即程序就死在这里。
B:跳转到一个标号。这里跳转到一个‘.’,即表示无线循环
7.6 用户堆栈初始化
ALIGN:对指令或者数据存放的地址进行对齐,后面会跟一个立即数。缺省表示 4 字节对齐。
首先判断是否定义了__MICROLIB,如果定义了这个宏则赋予标号__initial_sp(栈顶地址)、 __heap_base(堆起始地址)、__heap_limit(堆结束地址)全局属性,可供外部文件调用。有关这个宏我们在 KEIL 里面配置,具体见下图。然后堆栈的初始化就由 C 库函数_main来完成。
如果没有定义 __MICROLIB,则才用双段存储器模式 ,且声明标号_user_initial_stackheap具有全局属性,让用户自己来初始化堆栈。
IF,ELSE,ENDIF:汇编的条件分支语句,跟 C 语言的 if ,else 类似
END:文件结束
8、总结
至此我们总结一下STM32的启动文件和启动过程。整个启动中,首先是上电后硬件自动从已经下载至代码区起始处建立的中断向量表的第一个表项栈顶地址数据赋给栈指针SP,然后自动从把向量表第二个表项是复位中断服务入口地址读取其赋给PC,然后在复位中断服务程序中,调用SystemInit函数对系统时钟初始化,然后通过软件设置SP跳转C/C++标准实时库的__main函数,在加载Flash中.date .bss同时,对栈和堆进行初始化,完成用户堆栈等的初始化后,跳转.c文件中的main函数开始执行C程序,这就是整个启动过程。若STM32被设置为从内部FLASH启动中断向量表起始地位为0x8000000,则栈顶地址存放于0x8000000处,而复位中断服务入口地址存放于0x8000004处。当STM32遇到复位信号后,则从0x80000004处取出复位中断服务入口地址,继而执行复位中断服务程序,然后跳转__main函数,最后进入main函数。