一、Hard fault产生原因
硬件方面常见原因:
1.电源设计有错误,造成器件供电不稳;
2. 电源质量不好,文波,噪声过大;
3. 器件接地不良;
4. 对于带有Vcap引脚的器件,管脚处理不当;
5. 电路中有强干扰源,对器件造成干扰;
软件方面常见原因:
6.使用了空指针;
7.对地址偏移量的计算有误;
8. 数组越界导致程序出错;
9. 动态内存使用不当,导致访问了已释放的内存地址;
10. 通过地址访问了已失效的局部变量;
一般因为硬件造成Hard Fault错误的可能性较低,90%都是软件原因造成的。所以遇到硬件中断错误,基本就是通过软件来排查
二、排查问题使用到的工具
JLINK、Segger(JLINK上位机软件)、Keil or IAR、Cmbacktrace(有限制比如M23、M33内核不支持)
三、排查步骤
- 使用keil生成map文件,生成lst文件。
Map文件是keil自动生成的,里面能标明每个函数、每个变量的位置。他被放在工程路径下。
lst文件反映的是每一个函数,每一条指令的PC指针,在keil中需要调用USER命令生成:
命令行:
D:\Keil\ARM\ARMCC\bin\fromelf.exe -c --output ./project.lst ./obj/project.axf
D:\Keil\ARM\ARMCC\bin\fromelf.exe表示的是fromelf.exe的路径;
./obj/project.axf表示生成的axf文件位置,可能需要根据实际情况调整;
2.保存出问题时候的RAM;
出问题的时候调用别断电,接上Jlink,调用Segger里面的Jlink command来获取现场:
a.先输入一个“USB”让Jlink接上设备,然后输入halt来停住内核;
b.调用savebin ram.bin 0x20000000 0x2000将RAM中的内容全部保存下来;
保存下来的东西被存在放Segger的安装目录中。
3.分析问题
查看map文件找到栈的位置。
打开保存的bin文件,找到进入硬件中断前调用了哪些函数,在使用哪个变量,然后逐一分析。
从栈的底部往上看,哪个地方的值是函数指针,然后对应lst文件去逐一查看,分析,就能大致知道是在执行哪个函数,哪一条指令,或者是调用某个参数导致的硬件中断错误的。
通过map文件可以知道每个变量的位置,可以直接去查看我们保存下来的ram中变量的当前情况来分析程序逻辑。
Jlink Command使用方法:
f Firmware info用来查看Jlink的硬件版本
h halt用来停止MCU内核,可以查看内核的PC指针等特殊寄存器
g go用来激活被halt的内核
Sleep Waits the given time (in milliseconds). Syntax: Sleep 用来延时
s Single step the target chip单步调试代码,可以先执行halt,然后再来单步调试
st Show hardware status显示Jlink当前状态
hwinfo Show hardware info显示Jlink 的硬件信息
mem Read memory. Syntax: mem [:], (hex)
mem8 Read 8-bit items. Syntax: mem8 [:], (hex)
mem16 Read 16-bit items. Syntax: mem16 [:], (hex)
mem32 Read 32-bit items. Syntax: mem32 [:], (hex)
读取指令:
w1 Write 8-bit items. Syntax: w1 [:], (hex)
w2 Write 16-bit items. Syntax: w2 [:], (hex)
w4 Write 32-bit items. Syntax: w4 [:], (hex)
写指令:
erase Erase internal flash of selected device. Syntax: Erase
擦除指令,先选定器件然后再来执行擦除