达梦技术社区:https://eco.dameng.com
【场景说明】
使用dmrman恢复数据库,但是这种报错不限于DM数据库场景,其他应用也可能出现
【报错信息】
Segmentation fault (core dumped)
dmdba@whx02 172.16.72.129 17:16:47 $ dmrman CTLFILE=/tmp/MPP_02/recover.txt
dmrman V8
/tmp/MPP_02/recover.txt
restore database '/home/dmdba/dm8/data/MPP_02/dm.ini' from backupset '/home/dmdba/dm8/data/MPP_02/bak/BACKUP_FILE';
file dm.key not found, use default license!
【可能的报错原因】
- 1.内存访问越界
a) 由于使用错误的下标,导致数组访问越界
b) 搜索字符串时,依靠字符串结束符来判断字符串是否结束,但是字符串没有正常的使用结束符
c) 使用strcpy, strcat, sprintf, strcmp, strcasecmp等字符串操作函数,将目标字符串读/写爆。
应该使用strncpy, strlcpy, strncat, strlcat, snprintf, strncmp, strncasecmp等函数防止读写越界。
- 2. 多线程程序使用了线程不安全的函数。
- 3. 多线程读写的数据未加锁保护。
对于会被多个线程同时访问的全局数据,应该注意加锁保护,否则很容易造成core dump
- 4. 非法指针
a) 使用空指针
b) 随意使用指针转换。一个指向一段内存的指针,除非确定这段内存原先就分配为某种结构或类型,或者这种结构或类型的数组,否则不要将它转换为这种结构或类型 的指针,而应该将这段内存拷贝到一个这种结构或类型中,再访问这个结构或类型。这是因为如果这段内存的开始地址不是按照这种结构或类型对齐的,那么访问它 时就很容易因为bus error而core dump.
- 5. 堆栈溢出.
不要使用大的局部变量(因为局部变量都分配在栈上),这样容易造成堆栈溢出,破坏系统的栈和堆结构,导致出现莫名其妙的错误。
【问题处理】
配置操作系统使其产生core文件
首先通过ulimit
命 令查看一下系统是否配置支持了dump core
的功能。
通过ulimit -c
或ulimit -a
,可以查看core file大小的配置情况
- 如果为0,则表示系统关闭了dump core。
- 可以通过
ulimit -c unlimited
来打开。若发生了段错误,但没有core dump,是由于系统禁止core文件的生成。
解决方法:
ulimit -c unlimited
echo "ulimit -c unlimited" >> ~/.bashrc
source ~/.bashrc
达梦技术社区:https://eco.dameng.com