碰到一个内存越界,设备起来后不久报错并当机,串口打印为*** glibc detected *** ./server: double free or corruption (!prev): 0x08a03b88 ***
这个头疼的问题,和同事跟踪定位了三天,终于得到解决,下面分析下定位堆越界的过程,由于不在公司,不方便贴出源码及数据,只大概给出粗略的数据和过程:
这个内存越界死机问题,其实已经埋伏了很久,但太过偶现,大家也没注意,最近突然频繁死机,也给了我们定位的契机。double free or corruption (!prev): 0x08a03b88,glibc的这个报错,表示glibc检测到自己的内存头信息已经被破坏。
下面简单描述下ptmalloc的内存模型:
malloc_chunk结构的前两个成员(8字节).一段已分配的内存结构如下图所示:
0 16 32
chunk-> +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| 上一个块的字节数(如果上一个块空闲的话) | |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-