之前,在交换机(vxworks系统)测试的时候报了一个很诡异的问题:运行ospf路由协议的时候造成设备重启,而打印的break信息是在ripng模块死机。经过了多天的跟踪测试,终于发现是由于ospf任务中存在大量终端导致栈空间溢出进而修改了ripng模块的全局变量,后来把栈空间改大点就没问题了。但是这个问题是怎么发现的呢?在任务切换(vxworks是基于任务的)时加钩子函数,判断那个全局变量是否已经改变。
钩子函数如下:
static uint32 _sys_task_switch_recorder(TCB *pold, TCB *pnew)
{
if(ripngg != &r_master){
Print("old task name:%s, new task name:%s, %p, %p\n", pold->name, pnew->name,\
&r_master , ripngg);
}
return 0;
}
这样的钩子函数可以提供一种查找内存被篡改的方法。