int指令(软件中断指令__软件调试)__gdb调试中断断点原理

INT(软件中断指令)是CALL指令的一种特殊形式。call指令调用调用的子程序是用户程序的一部分,而INT指令调用的操作系统提供的子程序或者其他特殊的子程序。

 

中断服务子程序和标准过程的最大区别是 汇编程序可以有任意个过程,中断服务子程序最多有256个过程、

 

INT指令共有四中不同的格式:

 

《1》  int n

  n是中断号,这就允许用户程序调用256个中断服务子程序。

  该指令2字节长度,第一字节是int机器码,第二字节是8位立即数,表示中断号。

  CPU在执行到INT指令时,通过中断描述符表找到中断号对应的中断服务子程序的地址,(本质上就是一个异常处理程序的软件调用)

《2》 int 3

  INT 3 是中断指令的一种特殊形式,仅有一个字节长。

  调试器将该指令当作软件中断指令来用。调试的时候,当程序中的某一位置加断点的时候,调试器会把断点处指令编码的第一个字节替换为INT 3指令的编码。

当程序执行到INT 3,回向调试器申请系统调用,调试器因此获得CPU控制权。之后,再用原先的编码替换INT 3 编码。

 

 

《3》INTO    中断号4

  如果溢出标志位为1,则INTO指令会产生一个软件中断,利用这个指令可以快速测试算术运算指令之后是否有溢出产生。

《4》BOUND  中断号5

  BOUND reg,mem

  其执行算法为:if(reg<[mem])or(reg>[mem+sizeof(reg)]) then INT 5

  判断数组下表是否在合理范围内,不合理触发INT 5 中断,返回地址仍是BOUND

 

 

 不管是哪种,都会发生

(1)标志寄存器入栈

(2)CS:EIP 寄存器入栈,

(3)通过中断号在中断描述符表中找到对应的描述符,并将对应的数据放入CS:EIP中、

 

CS入栈和出栈都是一个32位值,只有低16位有效。扩充的高16位无定义,目的是使堆栈保持与4字节边界对齐。这对80386的性能来说很重要。。。么。。。。。

 

 

 

=====

摘要:平常编程调试的过程中,我们可能会有这样的疑惑:“为什么使用硬件模拟器,比如bochs调试的时候,开始设置的调试断点都不会生效?”,“断点调试的本质是什么,为什么程序能够在特定的地方停留下来?既然程序是指令流,为何CPU没有一直执行下去?”,“在软件中断的情况下,如何进行调试?”。断点和单步执行是两个经常使用的调试功能,也是调试器的核心功能。本章我们将介绍IA-32 CPU是如何支持断点和单步执行功能的,然后逐一为你解答这些疑问。

1.软件断点

x86系列处理器从其第一代产品英特尔8086开始就提供了一条专门用来支持调试的指令,即INT 3。简单地说,这条指令的目的就是使CPU中断(break)到调试器,以供调试者对执行现场进行各种分析。当我们调试程序时,可以在可能有问题的地方插入一条INT 3指令,使CPU执行到这一点时停下来。这便是软件调试中经常用到的断点(breakpoint)功能,因此INT 3指令又被称为断点指令。

下面,我们来测试一个程序:
1    #include<stdio.h>
2    #include<stdlib.h>
3    #include<unistd.h>
4    
5    int main()
6    {
7        printf("hello world");
8        __asm__("int $0x03");
9        printf("hello world");
10        return 0;
11    }

编译:gcc hello.c -o hello
调试:gdb hello 
(gdb) r
Starting program: /home/huangyk/doc/major/操作系统/hello 
Program received signal SIGTRAP, Trace/breakpoint trap.
main () at hello.c:9
9        printf("hello world");


可以看到,即使我们不在调试器中设置断点,也能正常中断
查看当前堆栈,定位IP(在64b机器下面,是rip)

(gdb) info frame
Stack level 0, frame at 0x7fffffffdaa0:
 rip = 0x4004db in main (hello.c:9); saved rip 0x30b3a1ed1d
 source language c.
 Arglist at 0x7fffffffda90, args: 
 Locals at 0x7fffffffda90, Previous frame's sp is 0x7fffffffdaa0
 Saved registers:
  rbp at 0x7fffffffda90, rip at 0x7fffffffda98

查看内存区域的对应数据
(gdb) x/10i $rip-20
   0x4004c7 <main+3>:    in     $0xb8,%eax
   0x4004c9 <main+5>:    clc    
   0x4004ca <main+6>:    add    $0x89480040,%eax
   0x4004cf <main+11>:    (bad)  
   0x4004d0 <main+12>:    mov    $0x0,%eax
   0x4004d5 <main+17>:    callq  0x4003b8 <printf@plt>
   0x4004da <main+22>:    int3   
=> 0x4004db <main+23>:    mov    $0x4005f8,%eax
   0x4004e0 <main+28>:    mov    %rax,%rdi
   0x4004e3 <main+31>:    mov    $0x0,%eax

我们可以清楚看见,刚才执行了一个int 3指令。断点异常(INT 3)属于陷阱类异常,当CPU产生异常时,其程序指针是指向导致异常的下一条指令的。
注意:在windows其他的调试器中不是这样,eip被设定成指向int 3指令。

2.在调试器中设置断点

考虑一下调试器是如何设置断点的。当我们在调试器中对代码的某一行设置断点时,调试器会先把这里的本来指令的第一个字节保存起来,然后写入一条INT 3指令。因为INT 3指令的机器码为11001100b(0xCC),仅有一个字节,所以设置和取消断点时也只需要保存和恢复一个字节,这是设计这条指令时须考虑好的。

我们将这个程序的汇编部分去掉,然后在line 8设置断点,接着调试:
(gdb) b 8
Breakpoint 1 at 0x4004da: file hello2.c, line 8.
(gdb) r
Starting program: /home/huangyk/doc/major/操作系统/two 
 
Breakpoint 1, main () at hello2.c:8
8        printf("hello world");
Missing separate debuginfos, use: debuginfo-install glibc-2.12-1.132.el6.x86_64
(gdb) x/10i $rip-20
   0x4004c6 <main+2>:    mov    %esp,%ebp
   0x4004c8 <main+4>:    mov    $0x4005f8,%eax
   0x4004cd <main+9>:    mov    %rax,%rdi
   0x4004d0 <main+12>:    mov    $0x0,%eax
   0x4004d5 <main+17>:    callq  0x4003b8 <printf@plt>
=> 0x4004da <main+22>:    mov    $0x4005f8,%eax
   0x4004df <main+27>:    mov    %rax,%rdi
   0x4004e2 <main+30>:    mov    $0x0,%eax
   0x4004e7 <main+35>:    callq  0x4003b8 <printf@plt>
   0x4004ec <main+40>:    mov    $0x0,%eax


你看到了什么?怎么没有int 3指令呢?
值得说明的是,在调试器下,我们是看不到动态替换到程序中的INT 3指令的。大多数调试器的做法是在被调试程序中断到调试器时,会先将所有断点位置被替换为INT 3的指令恢复成原来的指令,然后再把控制权交给用户。

3.断点命中
当CPU执行到INT 3指令时,由于INT 3指令的设计目的就是中断到调试器,因此,CPU执行这条指令的过程也就是产生断点异常(breakpoint exception,简称#BP)并转去执行异常处理例程的过程。在跳转到处理例程之前,CPU会保存当前的执行上下文,包括段寄存器、程序指针寄存器等内容。

注意:断点命中之后的中断服务程序是调试器来定义的,然后将服务入口注册到IDT中。

4.恢复执行

这里有一个问题,前面我们说当断点命中中断到调试器时,调试器会把所有断点处的INT 3指令恢复成本来的内容。因此,在用户发出了恢复执行命令后,调试器在通知系统真正恢复程序执行前,调试器需要将断点列表中的所有断点再落实一遍。但是对于刚才命中的这个断点需要特别对待,试想如果把这个断点处的指令也替换为INT 3,那么程序一执行便又触发断点了。但是如果不替换,那么这个断点便没有被落实,程序下次执行到这里时就不会触发断点,而用户并不知道这一点。对于这个问题,大多数调试器的做法都是先单步执行一次。也就是说,先设置单步执行标志(下一节将详细讨论),然后恢复执行,将断点所在位置的指令执行完。因为设置了单步标志,所以,CPU执行完断点位置的这条指令后会立刻再中断到调试器中,这一次调试器不会通知用户,会做一些内部操作后便立刻恢复程序执行,而且将所有的断点都落实(使用INT 3替换)。如果用户在恢复程序执行前,已经取消了当前的断点,那么就不需要先单步执行一次了。

5.特别用途—— 烫烫烫烫烫

因为INT 3指令的特殊性,所以它有一些特别的用途。让我们从一个有趣的现象说起。当我们用VC6进行调试时,常常会观察到一块刚分配的内存或字符串数组里面被填充满了"CC"。如果是在中文环境下,因为0xCCCC恰好是汉字"烫"字的简码,所以会观察到很多"烫烫烫……",而0xCC又正好是INT 3指令的机器码,这是偶然的么?答案是否定的。因为这是编译器故意这样做的。为了辅助调试,编译器在编译调试版本时会用0xCC来填充刚刚分配的缓冲区。这样,如果因为缓冲区或堆栈溢出时程序指针意外指向了这些区域,那么便会因为遇到INT 3指令而马上中断到调试器。

6.系统对int 3的优待

关于INT 3指令还有一点要说明的是,INT 3指令与当n=3时的INT n指令(通常所说的软件中断)并不同。INT n指令对应的机器码是0xCD后跟1字节n值,比如INT 23H 会被编译为0xCD23。与此不同的是,INT 3指令具有独特的单字节机器码0xCC。而且系统会对INT 3指令给予一些特殊的待遇,比如在虚拟8086模式下免受IOPL检查等。

7.为什么看不到调试期写入的int 3指令
因为,调试器总是“执行到b line,替换为int 3指令,调用中断,恢复int 3之前的指令,将现场返回给用户”,所以,int 写入但是又被置换,整个过程对用于是透明的。

8.归纳与解惑

因为使用INT 3指令产生的断点是依靠插入指令和软件中断机制工作的,因此人们习惯把这类断点称为软件断点,软件断点具有如下局限性。

属于代码类断点,即可以让CPU执行到代码段内的某个地址时停下来,不适用于数据段和I/O空间。

对于在ROM(只读存储器)中执行的程序(比如BIOS或其他固件程序),无法动态增加软件断点。因为目标内存是只读的,无法动态写入断点指令。这时就要使用我们后面要介绍的硬件断点。

在中断向量表或中断描述表(IDT)没有准备好或遭到破坏的情况下,这类断点是无法或不能正常工作的,比如系统刚刚启动时或IDT被病毒篡改后,这时只能使用硬件级的调试工具。

虽然软件断点存在以上不足,但因为它使用方便,而且没有数量限制(硬件断点需要寄存器记录断点地址,有数量限制),所以目前仍被广泛应用。

回到我们最开始提出的问题:由于调试是和调试期密切相关的,在用bochs+freedos 来调试操作系统的时候,如果在我们自己的操作系统起来之前,这时候不满足软件中断的使用条件,所以会设置断点失败,需要利用硬件中断,xchg bx,bx;进入到系统之后,然后就可以使用正常的软件中断了。


参考:<软件调试>第四章第一节http://book.51cto.com/art/200812/100663.htm
————————————————
版权声明:本文为CSDN博主「谁不小心的」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/trochiluses/article/details/20209593

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值