1、执行环境是这样的。一个进程启动,等待后续发送rpc信息到这个进程,这个进程根据这个RPC命令处理相应的流程。命令执行需要分多个步骤。比如第一阶段-》第二阶段-〉第三阶段。。。。
2、命令正常执行完成,也返回了正常的结果。但是隔了一会(2s)时间,进程crush.每次死在和这个进程处理RPC逻辑不想干的stack上,这个stack记录着依赖的另外的lib库的流程。
3、每次复现都死在这里。很是奇怪。本身这个stack的流程是不会触发的那为什么下发RPC命令处理完成后会crush呢,走读代码看RPC命令处理流程没有问题。
4、最后定位到是在RPC流程中malloc一个结构体变量,但是在malloc之后会进行memset操作,但是长度则是比这个malloc的结构体长,因此这里其实有踩内存的。于是修改了这里,程序正常了。
思考:后来想了下和这个问题,一直困扰了点时间后,总结一下,其实每次复线都是死在不相干的同一个堆栈信息,也就是说这个踩内存不是乱踩而是指定的踩,这里就可以总结其实是有一个地方固定踩了固定内容的的内存,而不是随便踩。因此memset memcp这样的嫌疑就很大。这里其实就是memset踩了固定的内存。而且每次踩的内容都固定不变。这样可以提高后续定位问题能力。