一个MCU系统往往都是由多个任务(Task)组成的。众多的任务在执行的过程中,如果出现某个任务卡死,如何确保系统能重启,并将卡死的任务定位下来呢?这些问题在MCU系统方案设计时都是需要考虑的。
本方案分为两部分,第一部分是系统各任务的监控,第一部分是硬件看门狗设计说明,第三部分是复位信息的日志保存和大数据统计。
一、任务的监控:
1、任务的监控的原理如下:
软件看门狗处理任务处于最高优先级任务。软件看门狗处理任务除了执行看门狗喂狗动作外,同时还按照优先级顺序监控每一个任务。一但运行周期出现没喂狗的任务,则启动1s计时。计时超时前该任务恢复看门狗喂狗,则关闭计时,否则记录该任务错误到EEPROM,并停止看门狗喂狗,让系统软件复位。
2、MCU系统任务优先级定义:
在软件看门狗监控任务时,需人为的定义各个任务的优先级。
二、硬件看门狗设计说明:
如果设计了硬件看门狗,一旦MCU系统出现硬件错误时,就会进入硬件错误处理函数,该函数实际做的事情触发一个MCU复位。设计应该先喂狗以确保不发送看门狗复位,然后才将堆栈指针保存到EEPROM,最后再触发MCU复位。
三、复位信息的日志保存和大数据统计:
1、流程示意图:略
2、大数据平台统计方法说明:
软件看门狗重启次数计算方法:每收到一次JSON字段中有WdgRstCount,将过去收到的WdgRstCount与现在收到的WdgRstCount相比,若发生了变化,大数据将现在收到的WdgRstCount做统计,并且更新过去收到的WdgRstCount为现在收到的WdgRstCount。
3、大数据数据的查看:
登录大数据系统,可以查看车载播放器的MCU系统的出现复位的占比、趋势,也可以查看某个MCU系统的出现复位的类型、时间、次数等。
以上设计已经在两个量产项目上使用,对定位复位问题非常有帮助。