调试器工作原理之二——实现断点(ptrace)

最新推荐文章于 2023-07-22 15:17:41 发布

weixin_33895016

最新推荐文章于 2023-07-22 15:17:41 发布

阅读量1.6k

点赞数 3

原文链接：http://blog.51cto.com/laokaddk/978688

版权

本文详细介绍了调试器中断点机制的实现，主要聚焦于x86体系结构上的软中断，特别是`int 3`指令。通过CPU的`int 3`指令，当程序执行到该指令时，操作系统会发送一个SIGTRAP信号，使进程暂停，从而实现断点。在Linux上，调试器利用ptrace系统调用来跟踪和管理断点。文中还展示了如何手动设置和管理断点，并简要讨论了进程地址空间和入口点的相关知识。

摘要由CSDN通过智能技术生成

本文是关于调试器工作原理探究系列的第二篇。在开始阅读本文前，请先确保你已经读过本系列的第一篇（基础篇）。

本文的主要内容

这里我将说明调试器中的断点机制是如何实现的。断点机制是调试器的两大主要支柱之一 ——另一个是在被调试进程的内存空间中查看变量的值。我们已经在第一篇文章中稍微涉及到了一些监视被调试进程的知识，但断点机制仍然还是个迷。阅读完本文之后，这将不再是什么秘密了。

软中断

要在x86体系结构上实现断点我们要用到软中断（也称为“陷阱”trap）。在我们深入细节之前，我想先大致解释一下中断和陷阱的概念。

CPU有一个单独的执行序列，会一条指令一条指令的顺序执行。要处理类似IO或者硬件时钟这样的异步事件时CPU就要用到中断。硬件中断通常是一个专门的电信号，连接到一个特殊的“响应电路”上。这个电路会感知中断的到来，然后会使CPU停止当前的执行流，保存当前的状态，然后跳转到一个预定义的地址处去执行，这个地址上会有一个中断处理例程。当中断处理例程完成它的工作后，CPU就从之前停止的地方恢复执行。

软中断的原理类似，但实际上有一点不同。CPU支持特殊的指令允许通过软件来模拟一个中断。当执行到这个指令时，CPU将其当做一个中断——停止当前正常的执行流，保存状态然后跳转到一个处理例程中执行。这种“陷阱”让许多现代的操作系统得以有效完成很多复杂任务（任务调度、虚拟内存、内存保护、调试等）。

一些编程错误（比如除0操作）也被CPU当做一个“陷阱”，通常被认为是“异常”。这里软中断同硬件中断之间的界限就变得模糊了，因为这里很难说这种异常到底是硬件中断还是软中断引起的。我有些偏离主题了，让我们回到关于断点的讨论上来。

关于int 3指令

看过前一节后，现在我可以简单地说断点就是通过CPU的特殊指令——int 3来实现的。int就是x86体系结构中的“陷阱指令”——对预定义的中断处理例程的调用。x86支持int指令带有一个8位的操作数，用来指定所发生的中断号。因此，理论上可以支持256种“陷阱”。前32个由CPU自己保留，这里第3号就是我们感兴趣的——称为“trap to debugger”。

不多说了，我这里就引用“圣经”中的原话吧（这里的圣经就是Intel’s Architecture software developer’s manual, volume2A）：

“INT 3指令产生一个特殊的单字节操作码（CC），这是用来调用调试异常处理例程的。（这个单字节形式非常有价值，因为这样可以通过一个断点来替换掉任何指令的第一个字节，包括其它的单字节指令也是一样，而不会覆盖到其它的操作码）。”

上面这段话非常重要，但现在解释它还是太早，我们稍后再来看。

使用int 3指令

是的，懂得事物背后的原理是很棒的，但是这到底意味着什么？我们该如何使用int 3来实现断点机制？套用常见的编程问答中出现的对话——请用代码说话！

实际上这真的非常简单。一旦你的进程执行到int 3指令时，操作系统就将它暂停。在Linux上（本文关注的是Linux平台），这会给该进程发送一个SIGTRAP信号。

这就是全部——真的！现在回顾一下本系列文章的第一篇，跟踪（调试器）进程可以获得所有其子进程（或者被关联到的进程）所得到信号的通知，现在你知道我们该做什么了吧？

就是这样，再没有什么计算机体系结构方面的东东了，该写代码了。

手动设定断点

现在我要展示如何在程序中设定断点。用于这个示例的目标程序如下：

 
          section    .text  
         
              ; The _start symbol must be declared for 
          the linker (ld)  
         
              global _start  
         
          _start:  
         
              ; Prepare arguments for 
          the sys_write system 
          call:  
         
              ;   - eax: system 
          call number (sys_write)  
         
              ;   - ebx: file descriptor (stdout)  
         
              ;   - ecx: pointer to string  
         
              ;   - edx: string length  
         
              mov     edx, len1  
         
              mov     ecx, msg1  
         
              mov     ebx, 1  
         
              mov     eax, 4  
         
              ; Execute the sys_write system 
          call  
         
              int     
          0x80  
         
              ; Now print the other message  
         
              mov     edx, len2  
         
              mov     ecx, msg2  
         
              mov     ebx, 1  
         
              mov     eax, 4  
         
              int     
          0x80  
         
              ; Execute sys_exit  
         
              mov     eax, 1  
         
              int     
          0x80  
         
          section    .data  
         
          msg1    db      'Hello,', 0xa  
         
          len1    equ     $ - msg1  
         
          msg2    db      'world!', 0xa  
         
          len2    equ     $ - msg2

我现在使用的是汇编语言，这是为了避免当使用C语言时涉及到的编译和符号的问题。上面列出的程序功能就是在一行中打印“Hello，”，然后在下一行中打印“world！”。这个例子与上一篇文章中用到的例子很相似。

我希望设定的断点位置应该在第一条打印之后，但恰好在第二条打印之前。我们就让断点打在第一个int 0×80指令之后吧，也就是mov edx, len2。首先，我需要知道这条指令对应的地址是什么。运行objdump –d：

最低0.47元/天解锁文章

weixin_33895016

关注

3
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
调试器工作原理之二——实现断点(ptrace)

本文是关于调试器工作原理探究系列的第二篇。在开始阅读本文前，请先确保你已经读过本系列的第一篇（基础篇）。本文的主要内容这里我将说明调试器中的断点机制是如何实现的。断点机制是调试器的两大主要支柱之一 ——另一个是在被调试进程的内存空间中查看变量的值。我们已经在第一篇文章中稍微涉及到了一些监视被调试进程的知识，但断点机制仍然还是个迷。阅读完本文之后，这将不再是什么秘密了。...
复制链接

扫一扫