我们先看看我们的测试程序:
/* in eg1.c */
int wib(int no1, int no2)
{
int result, diff;
diff = no1 - no2;
result = no1 / diff;
return result;
}
int main()
{
pid_t pid;
pid = fork();
if (pid <0) {
printf("fork err\n");
exit(-1);
} else if (pid == 0) {
/* in child process */
sleep(60); ------------------ (!)
int value = 10;
int div = 6;
int total = 0;
int i = 0;
int result = 0;
for (i = 0; i < 10; i++) {
result = wib(value, div);
total += result;
div++;
value--;
}
printf("%d wibed by %d equals %d\n", value, div, total);
exit(0);
} else {
/* in parent process */
sleep(4);
wait(-1);
exit(0);
}
}
该测试程序中子进程运行过程中会在wib函数中出现一个'除0'异常。现在我们就要调试该子进程。
[调试原理]
不知道大家发现没有,在(!)处在我们的测试程序在父进程fork后,子进程调用sleep睡了60秒。这就是关键,这个sleep本来是不该存在于子进程代码中的,而是而了使用GDB调试后加入的,它是我们调试的一个关键点。为什么要让子进程刚刚运行就开始sleep呢?因为我们要在子进程睡眠期间,利用 shell命令获取其process id,然后再利用gdb调试外部进程的方法attach到该process id上,调试该进程。
[调试过程]
我觉上面的调试原理的思路已经很清晰了,剩下的就是如何操作的问题了。我们来实践一次吧!
我所使用的环境是Solaris OS 9.0/GCC 3.2/GDB 6.1。
GDB 调试程序的前提条件就是你编译程序时必须加入调试符号信息,即使用'-g'编译选项。首先编译我们的源程序'gcc -g -o eg1 eg1.c'。编译好之后,我们就有了我们的调试目标eg1。由于我们在调试过程中需要多个工具配合,所以你最好多打开几个终端窗口,另外一点需要注意的是最好在eg1的working directory下执行gdb程序,否则gdb回提示'No symbol table is loaded'。你还得手工load symbol table。好了,下面我们就'按部就班'的开始调试我们的eg1。
执行eg1:
eg1 & --- 让eg1后台运行吧。
查找进程id:
ps -fu YOUR_USER_NAME
运行gdb:
gdb
(gdb) attach xxxxx --- xxxxx为利用ps命令获得的子进程process id
(gdb) stop --- 这点很重要,你需要先暂停那个子进程,然后设置一些断点和一些Watch
(gdb) break 37 -- 在result = wib(value, div);这行设置一个断点,可以使用list命令察看源代码
Breakpoint 1 at 0x10808: file eg1.c, line 37.
(gdb) continue
Continuing.
Breakpoint 1, main () at eg1.c:37
37 result = wib(value, div);
(gdb) step
wib (no1=10, no2=6) at eg1.c:13
13 diff = no1 - no2;
(gdb) continue
Continuing.
Breakpoint 1, main () at eg1.c:37
37 result = wib(value, div);
(gdb) step
wib (no1=9, no2=7) at eg1.c:13
13 diff = no1 - no2;
(gdb) continue
Continuing.
Breakpoint 1, main () at eg1.c:37
37 result = wib(value, div);
(gdb) step
wib (no1=8, no2=8) at eg1.c:13
13 diff = no1 - no2;
(gdb) next
14 result = no1 / diff;
(gdb) print diff
$6 = 0 ------- 除数为0,我们找到罪魁祸首了。
(gdb) next
Program received signal SIGFPE, Arithmetic exception.
0xff29d830 in .div () from /usr/lib/libc.so.1
至此,我们调试完毕。
一、列文件清单
list / l
列出产生执行文件的源代码的一部分
- //列出 line1 到 line2 行之间的源代码
- (gdb) list line1, line2
- //输出从上次调用list命令开始往后的10行程序代码
- (gdb) list
- //输出第 n 行附近的10行程序代码
- (gdb) list n
- //输出函数function前后的10行程序代码
- (gdb) list function
二、执行程序
run / r
运行准备调试的程序,在它后面可以跟随发给该程序的任何参数,包括标准输入和标准输出说明符(<和>)和shell通配符(*、?、[、])在内。
如果你使用不带参数的run命令,gdb就再次使用你给予前一条run命令的参数,这是很有用的。
set args
命令就可以修改发送给程序的参数,而使用
show args
命令就可以查看其缺省参数的列表。
- (gdb) set args –b –x
- (gdb) show args
三、显示数据
print / p
查看变量的值
- //利用print 命令可以检查各个变量的值。
- (gdb) print p (p为变量名)
print 是 gdb 的一个功能很强的命令,利用它可以显示被调试的语言中任何有效的表达式。表达式除了包含你程序中的变量外,还可以包含以下内容:
- //对程序中函数的调用
- (gdb) print find_entry(1, 0)
- //数据结构和其他复杂对象
- (gdb) print *table_start
- $8={e=reference=’\000’,location=0x0,next=0x0}
- //值的历史成分
- (gdb)print $1 ($1为历史记录变量,在以后可以直接引用 $1 的值)
whatis
查看变量的类型
- //whatis 命令可以显示某个变量的类型
- (gdb) whatis p
- type = int *
四、设置与清除断点
break / b
- //使程序恰好在执行给定行之前停止
- break line-number
- //使程序恰好在进入指定的函数之前停止
- break function-name
- //如果condition(条件)是真,程序到达指定行或函数时停止
- break line-or-function if condition
- //在指定例程的入口处设置断点
- break routine-name
- (gdb) break filename:line-number
- (gdb) break filename:function-name
要想设置一个条件断点,可以利用break if命令,如下所示:
- (gdb) break line-or-function if expr
- (gdb) break 46 if testsize==100
清除原文件中某一代码行上的所有断点
注:number 为原文件的某个代码行的行号
五、断点的管理
1. 显示当前gdb的断点信息
info break
2. delete 删除指定的某个断点
delete breakpoint
- //该命令将会删除编号为1的断点
- (gdb) delete breakpoint 1
- //如果不带编号参数,将删除所有的断点
- (gdb) delete breakpoint
disable breakpoint 1
enable breakpoint 1
该命令将禁止、允许断点 1,同时断点信息的 (Enb)域将变为 n、y
六、单步执行
next / n
不进入的单步执行
step
进入的单步执行
finish
如果已经进入了某函数,而想退出该函数返回到它的调用函数中,可使用命令finish
until
结束当前循环
七、函数的调用
call name
调用和执行一个函数
- (gdb) call gen_and_sork( 1234,1,0 )
- (gdb) call printf(“abcd”)
- $1=4
八、 原文件的搜索
search text
该命令可显示在当前文件中包含text串的下一行。
reverse-search text
该命令可以显示包含text 的前一行。
小结:常用的 gdb 命令
backtrace / bt 显示程序中的当前位置和表示如何到达当前位置的栈跟踪(同义词:where)
breakpoint / b 在程序中设置一个断点
cd 改变当前工作目录
clear 删除刚才停止处的断点
commands 命中断点时,列出将要执行的命令
continue 从断点开始继续执行
delete 删除一个断点或监测点;也可与其他命令一起使用
display 程序停止时显示变量和表达时
down 下移栈帧,使得另一个函数成为当前函数
frame 选择下一条continue命令的帧
info 显示与该程序有关的各种信息
jump 在源程序中的另一点开始运行
kill 异常终止在gdb 控制下运行的程序
list 列出相应于正在执行的程序的原文件内容
next 执行下一个源程序行,从而执行其整体中的一个函数
print 显示变量或表达式的值
pwd 显示当前工作目录
ptype 显示一个数据结构(如一个结构或C++类)的内容
quit 退出gdb
reverse-search 在源文件中反向搜索正规表达式
run 执行该程序
search 在源文件中搜索正规表达式
set variable 给变量赋值
signal 将一个信号发送到正在运行的进程
step 执行下一个源程序行,必要时进入下一个函数
undisplay display 命令的反命令,不要显示表达式
until 结束当前循环
up 上移栈帧,使另一函数成为当前函数
watch 在程序中设置一个监测点(即数据断点)
whatis 显示变量或函数类型