01
前言
在嵌入式软件开发中,因为代码质量不佳、线程冲突、栈溢出等问题,会造成Arm的HardFault。这种异常通常存在偶发性、不确定性、复现困难的特点,同时复现后软件已经跑飞,程序在何处异常、异常时的临时变量环境等都不好查找。在开发中出现此问题后往往意味着长时间的复现问题并debug,常常陷入毫无头绪的排查,耗费了不少程序员的头发。现总结了一些处理这类问题的经验以共享。
02
串口打印跟踪
在代码中插入串口打印,看死机时输出的最后一个串口信息在哪里。但是从代码里串口输出到硬件打印出数据,有一定延迟。出错的代码在最后输出的串口后边,无法确切定位。找到大概出错范围后根据经验验证代码,看有没有明显错误的地方。
03
仿真器追踪
在串口查找死机耗时大于两个小时的时候有必要使用仿真器追踪。
在代码中插入一个全局变量,每一个段给全局变量赋值。在中断的void HardFault_Handler(void)函数中设置断点。死机时进入断点查看全局变量的数值确定死机位置。
另外死机是可以view->call stack 中看到出错时调用的函数,以及函数中局部变量的值,通过这些信息推断出错原因。
04
通过堆栈查找最后一条语句
在中断HardFault_Handler中打上断点,程序跑飞后会停在此处: