一文讲透!Windows内核 & x86中断机制详解

搞内核研究的经常对中断这个概念肯定不陌生,经常我们会接触很多与中断相关的术语,按照软件和硬件进行分类:

硬件CPU相关:

  • IRQ
  • IDT
  • cli&sti

软件操作系统相关:

  • APC
  • DPC
  • IRQL

一直以来对中断这一部分内容弄的一知半解,操作系统和CPU之间如何协同工作也是很模糊。最近花了点时间认真把这块知识进行了梳理,不当之处,还请高手指出,先行谢过了!

本文旨在解答下面这些问题:

  • IRQ和IRQL之间是什么关系?
  • Windows是如何在软件层面上虚拟出IRQL这套中断机制的
  • APC和DPC都是软件中断,既然是中断那么对应的IDT表项中的处理例程在哪里呢?

0x00 Intel 80386处理器的中断

首先,让我们忘记Windows,从最开始的80386处理器开始,看看Intel设计它的时候是如何处理中断这个东西的。

先来看看这个诞生于1985年的CPU长什么样子:
在这里插入图片描述
看看那些伸出来的引脚,下面是它的引脚标注图:
在这里插入图片描述
注意用红圈标注的两个引脚,这两个就是80386处理器为中断留出的两个引脚。其中INTR是可屏蔽中断输入口,NMI是不可屏蔽中断输入口。

那么中断是如何输入给处理器的呢?那么多外部设备,而这只有一个引脚(暂时只考虑可屏蔽中断),这里就需要为CPU配备一个管理中断的秘书——可编程中断控制器PIC。这个秘书需要干哪些活呢?外部设备的中断都从它来进入中央处理器,所以它负责从外设接收中断信号,并根据优先级向CPU发起中断请求。最开始的这个PIC角色是一个代号为8259A的芯片在进行扮演,这货长这样:
在这里插入图片描述
下面是它的引脚图:

在这里插入图片描述
其中IR0-IR7共8个引脚负责连接外部设备, 8259A PIC的每个IR口都连接着一条IRQ线,用于接收外设的中断信号。INT负责连接CPU的INTR引脚,用于向CPU发起中断请求。通常情况下,使用两片8259A芯片进行级联,一片连接CPU,称为主片,另一片连接到主PIC的IR2引脚,称为从片,这样总共就可以连接8+7=15个外设了。如下图所示:
在这里插入图片描述
在8259A中,默认情况下的优先级是主片IR0的中断请求优先级最高,主片IR7最低,从片IR0-7所有中断请求优先级都相当于IR2。所以IRQ线的优先级由高到低次序为IRQ0,IRQ1,IRQ8-15,IRQ3-7。这是默认情况,可以通过编程改变。

在8259a芯片内部有几个重要的寄存器:

中断请求寄存器: IRR,8bit,对应IR0-IR7,当对应引脚产生中断信号时,该bit位置1。

中断服务寄存器: ISR,8bit,对应IR0-IR7,当对应引脚的中断正在被CPU处理时,该bit位置1。

中断屏蔽寄存器: IMR,8bit,对应IR0-IR7,当对应位为1时,表示屏蔽该引脚产生的中断信号。

还有一个中断优先级判决器: PR,当中断引脚有信号时,结合这次产生中断的IRQ号和ISR中记录的当前正在处理的中断信息,根据优先级来决定是否把这个新的中断信号报告给CPU,以此来产生中断嵌套。

下面是这15条IRQ线分别连接的外设:
在这里插入图片描述
现在我们来看看这个秘书是如何和CPU之间进行协调工作的。

现在假设我们敲击了一个键盘按键,键盘有中断事件产生,这一事件通过IRQ1这根线告知了主PIC,主PIC经过内部一些判断处理后通过INT发送电信号到CPU侧的INTR。CPU在执行完当前的指令后,检查到INTR有信号,说明有中断请求来了,再检查eflags中的IF不为零,表示当前允许中断,则发送信号给PIC的-INTA,告诉它把本次中断的向量号发送过来。主PIC收到-INTA管脚上的信号后,通过D0-D7引脚,输出此次中断的中断向量号到数据总线(这里简化了交互过程,实际上有两次INTA信号的发送)。CPU拿到这个号后,就可以从IDT中寻找中断服务例程(ISR)进行处理了,后面的事大家都知道了。

那PIC中的中断向量号是怎么来的呢?各个IRQ是如何对应到IDT中的各个项呢?这里就利用了中断控制器的可编程性来决定的了。

PIC全称为可编程中断控制器,那么它的可编程体现在哪些方面呢?参考资料2《i8259A中断控制器分析一》一文有比较详细的描述,大体包括编程指定主从片的IRQ线对应的中断在IDT表中的中断向量号、8259a中断控制器的中断方式、优先级方式、中断嵌套方式,中断屏蔽方式、中断结束方式等等,这些都可以由操作系统编程指定。具体的编程格式在参考资料3《i8259A中断控制器分析二》一文中有图文介绍。

回到上一个问题,IRQ线上的中断如何和IDT中的条目对应起来,操作系统在初始化的时候,会通过对8259a芯片编程(读写I/O端口),将指定PIC芯片的起始向量号,并要求低三位为0,起始向量号按照8对齐,这样规定的原因是,当中断发生时,低三位将自动填充对应的IRQ号,这样就可以和起始向量号相加直接送给数据总线从而被CPU拿到。具体到Windows中,系统初始化的时候对PIC的编程为:指定主片的起始中断向量号为0x30,指定从片的起始中断向量号为0x38。这样,通过中断控制器连接的15个外设将被平坦的映射到IDT中0x30-0x40这一范围中。Windows内核启动初始化过程中使用了hal!HalpInitializePICs对8259a芯片进行编程,ReactOS中代码如下:

在这里插入图片描述
其中0x20,0x21是主片的IO端口,0xa0,0xa1是从片的IO端口:
在这里插入图片描述
PRIMARY_VECTOR_BASE定义为:
在这里插入图片描述
具体8259a的编程方法就是读写IO端口,设置对应的控制命令,不用深入研究。我们来看Windows编程8259a的时候指定了哪些东西。

  • 1、指定了主片的工作方式为级联、中断方式为电信号边沿触发
  • 2、指定了主片IRQ的中断向量映射基址:0x30
  • 3、指定了主片的级联方式为使用了自己的IRQ2这个管脚
  • 4、指定了主片的工作模式为80x86模式,中断结束方式为普通结束模式
  • 5、指定了从片的工作方式为级联、中断方式为电信号边沿触发
  • 6、指定了从片IRQ的中断向量映射基址:0x38
  • 7、指定了从片的工作方式级联方式为主片的IRQ2这个管脚
  • 8、指定了从片的工作模式为80x86模式,中断结束方式为普通结束模式

至此我们可以知道,在使用8259A中断控制器的计算机上,通过IRQ线连接的那15个外设可屏蔽中断是被操作系统线性的映射到了IDT中的一个范围段。在Windows中是0x30-0x40(PS:在Linux中是0x20-0x2F),同时指定了中断控制器的中断方式为边沿触发,结束模式为普通结束模式(也就是需要CPU侧告知中断处理有没有结束并设置对应bit位,不能自动设置)。

0x02 8259a上的Windows IRQL

下面来看看IRQL。

从前面我们看到,硬件层面已经对中断的处理提供了很好的支持,需要操作系统做的也就两点:首先,初始化的时候对PIC进行编程设置其工作方式并对IRQ进行映射,让这些中断对应到IDT中的各个项,其次,实现这些IDT中的中断服务例程。似乎这样就够了,那Windows弄出来的一套IRQL又是什么东西呢?

看看《Windows Internals》一书对IRQL的定义:
在这里插入图片描述
写驱动的时候经常会接触到IRQL这个概念,它实现了Windows里的中断优先级制度,高优先级的中断总是可以优先被处理,而低优先级的中断则不得不等待高优先级中断被处理完后才得到处理。软件虚拟出来的这一套机制怎么能管到硬件的优先级呢?这是如何实现的呢?

先来解决两个问题:

1、IRQ和IRQL的关系是什么?、使用KeRaiseIrql提升当前IRQL后,为什么就能保证不被低优先级的中断打扰?

对于第一个问题,在使用8259a中断控制器的计算机中,IRQL=27-IRQ,其就是一个线性关系。

关于第二个问题,《Windows Internals》一书是这样解答的:
在这里插入图片描述
下面我们具体来看Windows的实现:

IRQL是一个完全虚拟出来的概念,Windows为了实现这一个虚拟的机制,完全虚拟了一个中断控制器,它在KPCR中:

+0x024 Irql         : UChar  //IRQL
+0x028 IRR          : Uint4B  //虚拟中断请求寄存器
+0x02c IrrActive    : Uint4B  //虚拟中断在服务寄存器
+0x030 IDR          : Uint4B  //虚拟中断屏蔽寄存器

在前面第一部分提到过,通过两片8259a芯片连接的15个中断源被映射到处理器IDT中的一段范围,具体Windows而言,是在0x30-0x40这个范围。这15个IDT中的中断描述符所描述的中断处理例程(ISR)不同于int 3所对应的KiTrap03和int 0e所对应的KiTrap0E,他们的ISR指向的代码位于各自的中断对象KINTERRUPT的DispatchCode。下面是这个结构的定义:

typedef struct _KINTERRUPT {
    CSHORT Type;
    CSHORT Size;
    LIST_ENTRY InterruptListEntry;
    PKSERVICE_ROUTINE ServiceRoutine;
    PVOID ServiceContext;
    KSPIN_LOCK SpinLock;
    ULONG TickCount;
    PKSPIN_LOCK ActualLock;
    PVOID DispatchAddress;
    ULONG Vector;
    KIRQL Irql;
    KIRQL SynchronizeIrql;
    BOOLEAN FloatingSave;
    BOOLEAN Connected;
    CHAR Number;
    UCHAR ShareVector;
    KINTERRUPT_MODE Mode;
    ULONG ServiceCount;
    ULONG DispatchCount;
    ULONG DispatchCode[106];
} KINTERRUPT, *PKINTERRUPT;

复制代码 DispatchCode里面的代码是根据一个模板来的,这些ISR处理开始和KiTrap03这些一样,首先会建立陷阱帧,然后会获取自己所在KINTERRUPT对象地址,得到这两个参数之后,便开始使用KiInterruptDispatch或KiChainedDispatch(如果对该中断注册了多个KINTERRUPT结构构成了链表使用此函数)进行中断派遣。而在这两个具体的派遣中都会先调用HalBeginSystemInterrupt,然后才会执行对应中断的实际处理工作,最后会执行HalEndSystemInterrupt完成此次中断处理。下面我们重点来看看这两个函数。

BOOLEAN
HalBeginSystemInterrupt(
    IN KIRQL Irql
    IN CCHAR Vector,
    OUT PKIRQL OldIrql);

输入参数Irql表示本次发生的中断对应的的IRQL,Vector表示中断向量号,如前所述,这两个参数都是DispatchCode从自己所在KINTERRUPT对象中取出来的。

HalBeginSystemInterrupt内部使用IRQL参数在一个表格中进行了分发,这个表中除了个别函数不同外(其实也只是多了一层判断),其他表项都是一致的,在ReactOS中名为HalpDismissIrqGeneric,该函数直接转而调用其下划线版本_HalpDismissIrqGeneric。这里就是IRQL优先级实现的核心所在了。该函数不长,下面是ReactOS中的代码(在Windows2000代码中是汇编形式不如ReactOS使用的C语言形式直观,所以采用了ReactOS的代码进行说明):
在这里插入图片描述
首先,判断本次发生的中断对应的IRQL与当前处理器(KPCR)中的IRQL进行比较,如果大于了当前处理器的IRQL,则表示来了一个优先级更高的中断,这时设置KPCR中的IRQL为这个新的更高的数值,后面返回了TRUE,表示需要处理这次中断请求。如果不大于当前处理器的IRQL的话,首先把本次中断记录记录到KPCR中的虚拟中断控制器的IRR值,然后就直接通过KiI8259MaskTable表中选取当前处理器IRQL对应的屏蔽码写入PIC,用以屏蔽那些IRQL比自己低的中断源,后面返回FALSE,表示不处理这次中断请求。为什么不在设置处理器新IRQL的时候就进行设置屏蔽码呢?《Windows Internals》是这样解释的:
在这里插入图片描述
HalpDismissIrqGeneric的返回值将直接作为HalBeginSystemInterrupt的返回值。以中断派遣函数KiInterruptDispatch为例看看它是如何使用这个返回值的:
在这里插入图片描述
可以看出,如果HalBeginSystemInterrupt返回了FALSE,则直接导致本次中断处理提前结束。只有当HalBeginSystemInterrupt返回了TRUE时,才继续执行真正的中断处理例程。最后, 情况下都会调用KiExitInterrupt结束中断处理过程,看一下这个函数。结合KiInterruptDispatch的代码,可以看出,只有当HalBeginSystemInterrupt返回的是TRUE时,下面的if条件才会成立,从而进入HalEndSystemInterrupt。
在这里插入图片描述
最后看一下HalEndSystemInterrupt,前面提到如果发生的中断对应的IRQL低于处理器的IRQL,则不会执行其ISR,但会在KPCR中的虚拟中断控制器的IRR中记录起来,等到处理器执行完了高IRQL的任务时,到了HalEndSystemInterrupt的时候,就会降低处理器的IRQL并重新设置PIC的中断屏蔽码,另外很重要的就是去检查IRR中的记录,如果记录中有比降低后的IRQL高的记录,则派遣该中断。

→【技术文档】←

总结

最后总结一下使用8259a中断控制器的计算机中Windows的IRQL。

首先,系统启动时对8259a芯片编程,设置其工作方式,并将15个中断源(IRQ)映射到IDT中的0x30-0x40这一段。

第二,Windows自己定义了一个称为中断请求级的IRQL概念用来描述中断的优先级别,IRQL是一个DWORD,共计32个级别,Windows使用一个简单的线性关系来映射IRQ和IRQL:IRQL=27-IRQ。

第三,被映射中断请求的0x30-0x40这一段的中断描述符的每个ISR都指向了一个KINTERRUPT结构中的DispatchCode,这段DispatchCode使用中断派遣函数KiInterruptDispatch或KiChainedDispatch进行中断派遣。

第四,派遣过程为:先使用HalBeginSystemInterrupt对本次中断的IRQL进行判断来决定是否需要处理本次中断,若不需要,则设置中断控制器的屏蔽码,防止再被打扰,同时将本次中断登记在KPCR中的虚拟中断控制器IRR中。若需要则提升IRQL,进而执行该中断的实际处理例程,执行完毕后使用HalEndSystemInterrupt降低IRQL,然后检查IRR有没有记录没被处理的中断以便在这个时候进行处理。

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
### 回答1: Linux内核是一种开源的操作系统内核,是Linux操作系统的核心组成部分。它提供了操作系统与硬件之间的抽象层,负责管理系统的资源、调度任务、提供驱动程序等功能。 Linux内核采用分层的架构,包括硬件抽象层、系统调用层、进程管理层、件系统层和网络层等。硬件抽象层负责将不同硬件设备的接口统一起来,使得上层的软件可以方便地与硬件进行通信。系统调用层提供了一组API供用户进程调用,如件操作、网络通信等。进程管理层负责进程的创建、销毁以及调度等任务。件系统层负责件的管理和存储。网络层负责网络协议的实现和网络通信。 Linux内核的工作原理可以简单概括为以下几个关键步骤。首先,当一台计算机启动时,BIOS会加载内核映像到内存中,并执行启动代码。然后,内核初始化各种数据结构、驱动程序和关键服务。接下来,内核创建一个初始的用户空间进程,称为init进程。init进程是所有其他进程的祖先进程。在此之后,内核根据调度算法来决定哪个进程可以使用CPU,并依次执行。同时,内核会提供一个中断机制,以便处理硬件事件的优先级。 内核还提供了许多系统调用供用户进程调用,以实现对各种功能的访问。当用户进程需要操作件、创建进程或进行网络通信时,会通过系统调用将请求传递给内核,由内核代表用户进程执行相应的操作。内核通过调度算法来分配CPU时间片,并通过虚拟内存管理来管理内存资源的分配和回收。 总而言之,Linux内核是一个高度可配置和模块化的操作系统内核,通过分层架构和系统调用机制实现了对硬件的抽象和对用户进程的管理。了解Linux内核的架构和工作原理,有助于深入理解Linux操作系统以及开发和调试相关应用程序。 ### 回答2: Linux是一种开源的操作系统内核,其设计目标是为了在不同的计算机硬件平台上提供高效的、稳定的和安全的操作系统服务。 Linux内核的架构可以分为三个主要部分:进程管理、内存管理和件系统管理。 在进程管理方面,Linux内核使用了多任务处理技术,可以同时运行多个进程。每个进程都有独立的地址空间和资源,通过调度算法可以合理分配CPU时间片,优化系统的响应速度和资源利用率。 在内存管理方面,Linux内核使用了虚拟内存技术,将物理内存和逻辑内存进行了映射,使得每个进程都有独立的地址空间。当物理内存不足时,Linux内核会通过页面置换算法将暂时不使用的页写入磁盘交换空间,以释放物理内存供其他进程使用。 在件系统管理方面,Linux内核支持多种件系统,包括传统的ext3和ext4件系统,以及现代的Btrfs和XFS件系统。它负责件的读写操作,以及件的权限控制和磁盘空间的管理。 Linux内核的工作原理可以简单概括为以下几个步骤:首先,启动引导程序将内核加载到内存中,并进行初始化。然后,内核分配一部分内存作为内核空间,用于存放内核代码和数据结构。接着,内核根据系统的硬件配置进行设备的初始化和驱动程序的加载。之后,内核根据系统的启动参数和配置件进行一系列的初始化工作,包括启动系统服务和加载用户程序。最后,内核进入主循环,不断地处理中断、调度进程、管理内存和件系统,以提供稳定的操作系统服务。 总之,Linux内核是一个复杂而高效的软件系统,它通过进程管理、内存管理和件系统管理等功能,实现了操作系统的基本功能。了解Linux内核的架构和工作原理,有助于我们更好地理解和使用这个优秀的开源操作系统。 ### 回答3: Linux内核是一个开放源代码的操作系统内核,由一个核心程序和一组通用的系统工具组成。它是Linux操作系统的核心,负责处理硬件设备、管理系统资源、实现进程管理、件系统和网络功能等。 Linux内核的架构可以分为两个层次:用户空间和内核空间。用户空间包括用户应用程序,如图形界面、终端程序等,它们通过系统调用接口与内核进行通信。内核空间包括内核核心的数据结构和程序,用于管理和控制硬件资源。 Linux内核的工作原理可以概括为以下几个方面: 1. 进程管理:内核负责创建、调度和终止进程。它使用进程描述符(task_struct)来跟踪进程的状态和资源使用情况,并根据调度算法分配CPU时间片给不同的进程。 2. 内存管理:内核负责管理系统的物理内存和虚拟内存。物理内存管理包括内存分配和释放,虚拟内存管理包括页面置换和页面回写等策略,以优化内存的使用效率。 3. 件系统:内核提供件系统接口,管理件和目录的创建、读写和删除等操作。它通过虚拟件系统层(VFS)将不同的件系统统一管理,如ext4、NTFS等。 4. 设备驱动:内核提供了访问硬件设备的接口,通过设备驱动程序与硬件交互。不同的硬件设备需要不同的驱动程序,如网卡、显卡、声卡等。 5. 网络功能:内核提供TCP/IP协议栈和网络设备驱动程序,用于实现网络通信功能。它提供网络连接的建立、数据传输和断开等功能,支持各种网络协议,如HTTP、FTP、SSH等。 总的来说,Linux内核是一个非常复杂且功能强大的软件,它负责管理计算机的各种资源和提供操作系统的各种功能。通过深入理解其架构和工作原理,我们可以更好地理解和使用Linux操作系统。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

我是黑客

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值