Win32 核心 DPC 设计思想和实现思路浅析

原创 2004年04月05日 22:58:00

http://flier_lu.blogone.net/?id=1397656


    x86架构设计在上是基于中断思想的,因而从DOS到Win32,操作系统中大量使用中断的概念来表达异步操作的行为。但与DOS下独占的情况不同,Win32下需要由系统对多任务进行调度,因此中断响应代码必须尽可能地简单,并且尽快的将控制权交还给系统。虽然这样一来系统调度的响应速度和实现过程方便了,但还是有很多功能需要在中断响应中完成。为此,Win32核心提供了DPC(Deferred Procedure Call)和APC(Asynchronous Procedure Call)两个IRQL特殊的软件中断级别,用于实现延迟和异步的过程调用。
    从IRQL分层来说,DPC和APC是介于较高级别的设备中断和最低级别的Passive中断之间,由操作系统用于完成特殊方法调用的中断级别。与处理硬件操作的设备中断和更高级别的时钟、处理器中断不同,这两级中断纯粹是为了实现功能调用异步性而设计实现的,因此操作系统本身也对它们具有很强的依赖型。APC这里暂且不讨论,以后有机会再写篇文章专门讨论 :)

    DPC在功能上可以理解为ISR(Interrupt Service Routine)的一部分。只是因为ISR为了尽量简单和返回控制权给操作系统,而将一部分功能剥离出来放入相应DPC中,延迟调用。因为DPC的IRQL仅在APC和Passive中断之上,所以系统可以从容地处理完高级别的中断后,再在DPC一级慢慢处理积累起来的相对并不那么紧急功能。
    DPC在使用上可以理解为一个回调函数的封装对象。系统本身或者设备驱动程序,在合适的地方如设备驱动程序的AddDevice函数或DispatchPnP函数处理IRP_MN_START_DEVICE请求时,初始化一个DPC对象;在ISR中判断是否需要进一步处理中断,是则请求将DPC对象插入到系统DPC队列中;系统处理完高IRQL后,会在IRQL DISPATCH_LEVEL级别慢慢处理DPC队列中的DPC对象;每个DPC对象封装的回调函数,会使用同时封装的调用参数,被系统调用,完成在ISR中来不及完成的工作;如果需要进一步的工作,还可以继续请求插入DPC对象到DPC队列中。

    DPC对象从最终用户角度有两种:DpcForIsr和CustomDPC。前者是与设备驱动对象(Device Object)绑定的;后者则由驱动自行维护。但从实现上来说,只有一种DPC对象存在,DpcForIsr所涉及的维护函数,实际上都是对CustomDPC的一个封装而已。

    我们首先来看看初始化DPC对象的实现。KeInitializeDpc函数(ntos/ke/dpcobj.c:39)完成具体的DPC对象的初始化,实际上就是填充一个内存结构KDPC(ntos/inc/ntosdef.h:331)。

以下为引用:

//
// Deferred Procedure Call (DPC) object
//

typedef struct _KDPC {
    CSHORT Type;
    UCHAR Number;
    UCHAR Importance;
    LIST_ENTRY DpcListEntry;
    PKDEFERRED_ROUTINE DeferredRoutine;
    PVOID DeferredContext;
    PVOID SystemArgument1;
    PVOID SystemArgument2;
    PULONG_PTR Lock;
} KDPC, *PKDPC, *RESTRICTED_POINTER PRKDPC;



    Type 表示此内核对象的类型,在KOBJECTS枚举类型(ntos/inc/ke.h:122)中定义,缺省为 DpcObject = 0x13。此外WinXP/2003新增了一种ThreadedDpcObject = 0x18
    Number 在多处理器环境下用于指定此DPC对象加入到哪个处理器的DPC队列中,我们等会讨论多处理器时详细描述。缺省为 0
    Importance 表示此DPC对象的重要性,在KDPC_IMPORTANCE枚举类型(ntos/inc/ntosdef.h:321)中定义,缺省为 MediumImportance = 1
    DpcListEntry 是用于维护DPC队列的链表指针
    DeferredRoutine 是此DPC对象绑定的回调函数,后面DeferredContext、SystemArgument1和SystemArgument2分别是此回调函数被调用时的参数。如ISR中调用IoRequestDpc时,后面两个参数就用于传递Irp和Context参数给DPC的回调函数。
    Lock 保存此DPC对象所在DPC队列的自旋锁,用于锁定DPC队列,同时也用于判断此DPC对象是否被加入到一个DPC队列中。

    了解了KDPC对象的结构,实际上维护代码就非常简单了。KeInitializeDpc函数将KDPC对象结构初始化为初值;IoInitializeDpcRequest函数则只是对KeInitializeDpc函数的一个简单包装,如下

以下为引用:

#define IoInitializeDpcRequest( DeviceObject, DpcRoutine ) (/
    KeInitializeDpc( &(DeviceObject)->Dpc,                  /
                     (PKDEFERRED_ROUTINE) (DpcRoutine),     /
                     (DeviceObject) ) )



    注意WinXP/2003下实际上KeInitializeDpc函数和KeInitializeThreadedDpc函数都是由一个KiInitializeDpc函数完成具体工作的,只是传递的最后一个参数定义的对象类型不同。

    KeInsertQueueDpc函数(ntos/ke/dpcobj.c:89)实际上是系统对DPC队列维护的核心函数,其伪代码如下:

以下为引用:

BOOLEAN KeInsertQueueDpc (IN PRKDPC Dpc, IN PVOID SystemArgument1,IN PVOID SystemArgument2)
{
  PKSPIN_LOCK Lock;
  KIRQL OldIrql;

  KeRaiseIrql(HIGH_LEVEL, &OldIrql);  // 提升当前IRQL到最高,屏蔽其它中断

  PKPRCB = KeGetCurrentPrcb();        // 获取当前处理器控制块

  // 通过比较Dpc->Lock是否为空,来判断此DPC对象是否已经被加入到DPC队列;
  // 如果DPC对象可以被加入到队列,则将当前处理器控制块的DPC自旋锁复制到Dpc->Lock中
  if ((Lock = InterlockedCompareExchangePointer(&Dpc->Lock, &Prcb->DpcLock, NULL)) == NULL)
  {
    // 更新当前处理器控制块的统计信息
    Prcb->DpcCount += 1;
    Prcb->DpcQueueDepth += 1;

    // 更新DPC对象的参数信息
    Dpc->SystemArgument1 = SystemArgument1;
    Dpc->SystemArgument2 = SystemArgument2;

    // 根据DPC对象优先级,决定将之加入到DPC队列的头部或尾部
    if (Dpc->Importance == HighImportance)
        InsertHeadList(&Prcb->DpcListHead, &Dpc->DpcListEntry);
    else
        InsertTailList(&Prcb->DpcListHead, &Dpc->DpcListEntry);

    // 如果当前处理器没有DPC对象活动或DPC中断请求,则进一步判断是否发出DPC中断请求
    if (Prcb->DpcRoutineActive == FALSE && Prcb->DpcInterruptRequested == FALSE)
    {
      // 如果DPC对象优先级为中高;
      // 或者DPC队列长度超过阈值MaximumDpcQueueDepth;
      // 或者DPC请求速率小于阈值MinimumDpcRate
      if ((Dpc->Importance != LowImportance) ||
          (Prcb->DpcQueueDepth >= Prcb->MaximumDpcQueueDepth) ||
          (Prcb->DpcRequestRate < Prcb->MinimumDpcRate))
      {
        // 满足触发条件,则发出DPC中断请求
        Prcb->DpcInterruptRequested = TRUE;
        KiRequestSoftwareInterrupt(DISPATCH_LEVEL);
      }
    }
  }
  KeLowerIrql(OldIrql);
  return (Lock == NULL);
}



    这里的几个阈值,在KiInitializeKernel函数(ntos/ke/i386/kernlini.c:246)中,根据全局变量KiMaximumDpcQueueDepth、KiMinimumDpcRate和KiAdjustDpcThreshold确定。而这几个全局变量可以通过注册表项(HKEY_LOCAL_MACHINE/SYSTEM/CurrentControlSet/Control/Session Manager/kernel/)下的DpcQueueDepth、MinimumDpcRate和AdjustDpcThreshold三个键值来设置。具体的设置方法,请参考MSDN以及性能计数器的Processor/% DPC Time等动态指数。

    而处理与驱动绑定的DPC对象的IoRequestDpc函数只是KeInsertQueueDpc函数的一个简单包装。

以下为引用:

#define IoRequestDpc( DeviceObject, Irp, Context ) ( /
    KeInsertQueueDpc( &(DeviceObject)->Dpc, (Irp), (Context) ) )



    与KeInsertQueueDpc函数对应的KeRemoveQueueDpc函数(ntos/ke/dpcobj.c:272)实际上只是完成简单的将DPC对象从DPC队列中删除的功能。

    最后对DPC对象属性进行修改的KeSetImportanceDpc函数(ntos/ke/dpcobj.c:367)和KeSetTargetProcessorDpc函数(ntos/ke/dpcobj.c:401)实际上都是直接修改DPC对象结构的相应域。KDPC::Number大于MAXIMUM_PROCESSORS = 32时,用于指定DPC对象的目标CPU。如调用KeSetTargetProcessorDpc(pKDpc, 2)后,pKDpc = MAXIMUM_PROCESSORS + 2。

    在了解了DPC对象和DPC队列的大致维护函数功能后,我们来看看稍微复杂一些的在多处理器下DPC队列的维护流程。

    前面提到KDPC::Number指定了DPC对象所用的处理器号,因此在KeInsertQueueDpc函数开始获取处理器控制块时,需要判断Number是否指向一个处理器,并从全局处理器控制块列表中获取相应的处理器控制块,为代码如下:

以下为引用:

if (Dpc->Number >= MAXIMUM_PROCESSORS)  // Number大于MAXIMUM_PROCESSORS时用于指定处理器
{
  Processor = Dpc->Number - MAXIMUM_PROCESSORS;
  Prcb = KiProcessorBlock[Processor];   // 全局唯一的处理器控制块列表

}
else
{
  Prcb = KeGetCurrentPrcb();
}

KiAcquireSpinLock(&Prcb->DpcLock);      // 使用自旋锁保护处理器控制块中的DPC队列



    而在KeInsertQueueDpc函数中判断是否发出DPC中断请求时,也需要做更复杂的逻辑判断。
    对DPC对象目标处理器就是当前处理器的情况,可以和前面单处理器时一样处理,直接发送DPC中断请求;但对于DPC对象目标处理器是其他处理器的情况,就必须使用KiIpiSend函数发送IPI(InterProcessor Interrupt)中断,通知目标处理器执行动作。此IPI中断是介于系统掉电中断(POWER_LEVEL)和时钟中断之间的特殊IRQL,专门用于在多处理器情况下协调多个处理器的工作。
    此外就是在多处理器情况下,各种对DPC队列的操作都需要用此处理器控制块的DPC队列自旋锁保护起来,避免同步问题。

    由此我们可以看到,实际上DPC队列是每个处理器一个的,我们完全可以将某个DPC对象绑定到某个处理器上,实现类似线程亲缘性(Thread Affinity)的效果,优化在多处理器环境下的性能。但这同时也带来一个问题,就是ISR程序可以和DPC回调函数同时被调用,某种程度上也造成了开发复杂度的增加,具体处理方法请参考DDK中相关文档。

    Kernel-Mode Driver Architecture/Design Guide/Servicing Interrupts/DPC Objects and DPCs

DPC(延迟过程调用)的技术细节

-DPC(延迟过程调用)的细节 NTINSIDER,16卷,1期,1至2月2009 延迟过程调用(DPC)是一种Windows常用功能。用途是广泛和多样的,但最常用的是我们通常所说的“ISR完成”...
  • lostit
  • lostit
  • 2013年11月01日 16:11
  • 7157

KeInsertQueueDpc简析

本来想把这个函数完整的还原出来,后来写着写着就发现头大,老是转不过弯来。它的反编译代码也不是很长,但是经过编译器处理后感觉还原起来很吃力。特别是一些调转,要将整个流程弄清楚才好写出来,还要注意变量的使...
  • pureman_mega
  • pureman_mega
  • 2017年12月19日 14:46
  • 47

Windows 驱动机制-定时、DPC及延时

1、定义Timer及DPC typedef struct _DEVICE_EXTENSION  {         .         .         .     K...
  • kulala082
  • kulala082
  • 2017年09月04日 11:46
  • 222

Win32 核心 DPC 设计思想和实现思路浅析

http://flier_lu.blogone.net/?id=1397656    x86架构设计在上是基于中断思想的,因而从DOS到Win32,操作系统中大量使用中断的概念来表达异步操作的行为。但...
  • flier_lu
  • flier_lu
  • 2004年04月05日 22:58
  • 1016

KeWaitForSingleObject简析

这个函数在进行同步操作时经常会用到,它内部的工作流程是什么样的呢?让我来试着分析分析吧. (以反编译的汇编代码片段为材料)NTSTATUS KeWaitForSingleObject( IN ...
  • pureman_mega
  • pureman_mega
  • 2017年12月29日 13:17
  • 29

Win32 核心 DPC 设计思想和实现思路浅析 [转载]

x86架构设计在上是基于中断思想的,因而从DOS到Win32,操作系统中大量使用中断的概念来表达异步操作的行为。但与DOS下独占的情况不同,Win32下需要由系统对多任务进行调度,因此中断响应代码必须...
  • sding
  • sding
  • 2009年09月24日 13:50
  • 634

转载:关于DPC和APC

当驱动程序处理IRP的时候,它可能立刻完成,也可能在中断里才能完成,比如说,往硬件设备发出一个请求(通常可以是写I/O port),当设备完成操作的时候会触发一个中断,然后在中断处理函数里得到操作结果...
  • zhiquan
  • zhiquan
  • 2009年06月03日 21:47
  • 3034

windows虚拟网卡驱动开发

by fanxiushu   2017-04-06 转载或引用请注明原始作者。 很早前的文章介绍过windows和linux平台的虚拟网卡技术, 详见      http://blog.csdn....
  • fanxiushu
  • fanxiushu
  • 2017年04月06日 19:05
  • 2006

windows内核函数、结构和全局变量

最近学习《Windows内核原理与实现》发现其博大精深,粗略过了一遍,很多东西比较茫然,看书之余把书中涉及的函数,结构,全局变量的所在页数总结出来,便于以后查阅。 由于半自动半手工,难免有写错的地方...
  • stonesharp
  • stonesharp
  • 2015年11月08日 11:32
  • 1526

DIY相册的思路和welcome界面

DIY相册的思路: DIY相册做出来的效果就是用户再看相册的时候感觉自己真的在翻一本相册一样。用APP呈现,可以更方便的做相册和看相册,拿起手机就可以了。 DIY相...
  • believe__yourself
  • believe__yourself
  • 2015年05月19日 00:07
  • 338
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Win32 核心 DPC 设计思想和实现思路浅析
举报原因:
原因补充:

(最多只允许输入30个字)