Linux内核学习之中断处理

0 前言

文本基于x86架构讲解Linux中对中断的处理,因此本文假定你已经阅读了x86架构学习之中断,了解了x86硬件中断的结构和行为。

1 中断处理程序的嵌套执行

  • 每个中断处理程序都代表一个内核控制路径,中断的嵌套执行(抢占),同时也意味着内核控制路径的嵌套执行,一个操作系统如果要保证高效的响应和IO,就必须允许中断嵌套。这也就意味着,Linux在系统运行的大部分时刻,都是开中断的。
  • 中断处理程序永远不会被用户态任务阻塞,这也意味着,在处理中断的时候,是不允许发生任务切换的。
  • 一个设计好、并经过大量测试的Linux内核,除了个别特定用途的异常,是不会在内核态产生异常的。异常要么由编程错误(如除以0)产生,要么由编程异常(int n指令)或调试指令(debug、bound指令)产生。除了缺页异常 ,Linux内核没有编程错误(如果没有bug),同时也不会调用产生异常的显式指令。缺页异常 被内核用于内存交换,并且被设计成绝不会再嵌套产生异常,因此内核态中,最多有两个嵌套异常(系统调用+缺页)。

1 Linux对x86异常的处理

中断号异常异常处理程序关联的Linux信号
0diveide errordevide_error()SIGFPE
1debugdebug()SIGTRAP
2NMInmi()NONE
3break pointint3()SIGTRAP
4overflowoverflow()SIGSEGV
5bound checkbounds()SIGSEGV
6invalid opcodeinvalid_op()SIGILL
7device not availabledevice_not_available()NONE
8double faultdoublefault_fn()NONE
9coprocessor segment overruncoprocessor_segment_oversun()SIGFPE
10invalid TSSinvalid_tss()SIGSEGV
11segment not presentsegment_not_present()SIGBUS
12stack exceptionstack_segment()SIGBUS
13general exceptiongeneral_protection()SIGSEGV
14page faultpage_fault()SIGSEGV
15intel reservednone()NONE
16float point errorcoprocessor_error()SIGFPE
17alignment checkalignment_check()SIGSEGV
18machine checkmachine_check()NONE
19SIMD float pointsimd_coprocessor_error()SIGFPE

Linux中向量用途

向量范围用途
0~31intel预定义的异常或保留
32~127外部中断
128用于系统调用
129~238外部中断
239本地APIC中断
240本地APIC高温中断
241~250Linux保留
251~253处理器间中断
254本地APIC错误中断
255本地APIC伪中断

1 Linux中的中断门描述符

x86架构中,被中断用到的中断描述符被其称为中断门描述符,Linux则进一步对这个门描述符进行细分类:

  • 中断门。用户态进程无法访问的x86中断门(通过设置DPL字段为0),所有的Linux中断处理程序都通过中断门激活,并且全部限制在内核态。
  • 系统陷阱门。用户态可以访问的一个x86陷阱门(设置DPL为3),通过系统门来激活三个Linux异常处理程序,它们的向量(中断号)是4、5、128,即,用户态下,可以使用into, bound, int 0x80三条指令,int 0x80是Linux中的系统调用。
  • 系统中断门。能够被用户态进程访问的x86中断门(设置DPL为3),与向量3相关的异常处理程序是由系统中断门激活的,因此,用户态下可以使用int3指令。
  • 陷阱门。用户态进程不能访问的一个x86陷阱门(设置DPL为0),大部分Linux异常处理程序都通过陷阱门来激活。
  • 任务门。用户态无法访问的x86任务门(设置DPL为0),Linux对double fault异常处理程序通过任务门激活。

刚上电时,CPU运行在实模式,IDT由BIOS初始化使用,之后由Linux接管重新初始化。内核代码中涉及初始化中断的描述符的代码如下:

/*  设置门描述符,gete:中断号,type:门类型,addr:中断程序入口逻辑地址,
    dpl:描述符特权级,ist:中断栈索引,具体参考前言中文章关于ist的描述 */
static inline void _set_gate(int gate, unsigned type, void *addr,
                 unsigned dpl, unsigned ist, unsigned seg)
{
    gate_desc s;
    pack_gate(&s, type, (unsigned long)addr, dpl, ist, seg);
    write_idt_entry(idt_table, gate, &s);
}
// 设置中断门:GATE_INTERRUPT + DPL=0
static inline void set_intr_gate(unsigned int n, void *addr)
{
    BUG_ON((unsigned)n > 0xFF);
    _set_gate(n, GATE_INTERRUPT, addr, 0, 0, __KERNEL_CS);
}
// 设置系统中断门:GATE_INTERRUPT + DPL=3
static inline void set_system_intr_gate(unsigned int n, void *addr)
{
    BUG_ON((unsigned)n > 0xFF);
    _set_gate(n, GATE_INTERRUPT, addr, 0x3, 0, __KERNEL_CS);
}
// 设置系统陷阱门:GATE_TRAP + DPL=3
static inline void set_system_trap_gate(unsigned int n, void *addr)
{
    BUG_ON((unsigned)n > 0xFF);
    _set_gate(n, GATE_TRAP, addr, 0x3, 0, __KERNEL_CS);
}
// 设置陷阱门:GATE_TRAP + DPL=0
static inline void set_trap_gate(unsigned int n, void *addr)
{
    BUG_ON((unsigned)n > 0xFF);
    _set_gate(n, GATE_TRAP, addr, 0, 0, __KERNEL_CS);
}
// 设置中断门:GATE_TASK + DPL=0
static inline void set_task_gate(unsigned int n, unsigned int gdt_entry)
{
    BUG_ON((unsigned)n > 0xFF);
    _set_gate(n, GATE_TASK, (void *)0, 0, 0, (gdt_entry<<3));
}

Linux中的中断描述符

Linux中用另一种描述符来描述中断状态和响应程序入口,在中断发生时,先通过intel的中断描述符表找到中断程序最初始的入口,在该程序中,Linux再访问自己配置号的中断描述符表,从表中提取指定中断号的描述符数据结构irq_desc,irq_desc中包含中断状态,以及中断处理程序,其原文字段含义如下。

fielddescription
irq_dataper irq and chip data passed down to chip functions
kstat_irqsirq stats per cpu
handle_irqhighlevel irq-events handler
preflow_handlerhandler called before the flow handler (currently used by sparc)
actionthe irq action chain
statusstatus information
core_internal_state__do_not_mess_with_itcore internal status information
depthdisable-depth, for nested irq_disable() calls
wake_depthenable depth, for multiple irq_set_irq_wake() callers
irq_countstats field to detect stalled irqs
last_unhandledaging timer for unhandled count
irqs_unhandledstats field for spurious unhandled interrupts
threads_handledstats field for deferred spurious detection of threaded handlers
threads_handled_lastcomparator field for deferred spurious detection of theraded handlers
locklocking for SMP
affinity_hinthint to user space for preferred irq affinity
affinity_notifycontext for notification of affinity changes
pending_maskpending rebalanced interrupts
threads_oneshotbitfield to handle shared oneshot threads
threads_activenumber of irqaction threads currently running
wait_for_threadswait queue for sync_irq to wait for threaded handlers
dir/proc/irq/ procfs entry
nameflow handler name for /proc/interrupts output

现在只需重点关注handle_irq、action、status三个字段:

  • handle_irq指向服务于整个中断线的处理程序;
  • action是一个链表,服务于共享该中断线的每个设备;
  • status是中断处理状态,目前有三种状态,空闲、挂起、处理中、禁用。

当硬件发生一个中断信号时,从硬件到Linux软件的处理流程如下:

请添加图片描述

硬中断

这个概念是针对中断紧急程度提出的,也是相对后文软中断而言的,指的是中断的实际处理程序就放在中断处理函数当中。在Linux中这种中断是紧急的(critical)或非紧急的(noncritical)。

紧急硬中断:

  • 中断实际处理程序在中断上下文,并在中断返回前执行完。
  • 中断执行期间,由硬件屏蔽其他中断(针对当前CPU)。紧急硬中断使用的是intel的中断门, 中断通过中断门进入中断处理程序时,会清理eflags.if标志位,即屏蔽中断1

非紧急硬中断:

  • 中断实际处理程序在中断上下文,并在中断返回前执行完。
  • 中断执行期间,中断是开启的(针对当前CPU),能够被高优先级中断打断(不能被同优先级打断)。非紧急硬中断使用的是intel的陷阱门,中断通过陷阱门进入中断处理程序时,不会清理eflags.if标志位,即保持中断开启。

软中断和tasklet

软中断即相对硬中断而言的,即非紧急可延迟中断(noncritical deferrable),指的是中断的实际处理程序没有放在中断处理函数当中,而是放在了中断返回之后。中断处理函数只负责简单的“应答”操作。推迟的中断处理被 Linux放在了专用的内核线程当中。

软中断

硬件中断信号发生时,触发触发中断处理函数的执行,硬中断会在中断上下文立即处理中断,而对于软中断,实际处理程序不在中断上下文,而被推迟到设计好的执行点执行。

  • 软中断执行主体不在中断上下文当中,但仍在内核态下执行。
  • 软中断使用的是intel的陷阱门,即开中断,不同于非紧急硬中断的是,软中断的实际处理程序由于放在中断上下文外,因此是可被低优先级中断打断的,但是,如果这个低优先级中断也是软中断,那么其实际处理程序的执行还是要经过排队的。
  • 软中断是可重入的。
  • 软中断是静态分配的(编译时)。

Linux为软中断分配了一个长度为32的数组(softirq_vec[32]),数组中每个元素(softirq_action)对应一个软中断,目前(3.10.89)仅使用9个。
Linux中使用的软中断(非最新内核):

软中断下标(优先级)说明
HI0处理高优先级tasklet
TIMER1时钟中断相关tasklet
NET_TX2网卡发包
NET_RX3网卡接包
BLOCK4
BLOCK_IOPOLL5
TASKLET6处理常规tasklet
SCHED7内核调度中断
HRTIMER8
RCU9RCU 锁中断
reserved10-31保留

查看系统每CPU软中断运行次数:

[root@localhost ~]# cat /proc/softirqs
                    CPU0       CPU1       CPU2       CPU3
          HI:          2          0         44          0
       TIMER:   74161634  108560055  104975829   97259447
      NET_TX:          0          0          0          1
      NET_RX:    1611551    1540001    1480112    1868864
       BLOCK:     692874     288353     242228     223828
BLOCK_IOPOLL:          0          0          0          0
     TASKLET:        493          0        396          0
       SCHED:   21956594   24238388   22492040   20494488
     HRTIMER:          0          0          0          0
         RCU:   49602186   71933466   69620972   64742279

tasklet2

tasklet是在软中断的基础上设计出来新子类,在上文中,HI 和 TASKLET 被用于tasklet,前者表高优先级的 tasklet,后者表低优先级的tasklet。
tasklet以拉链的形式挂载在 HI 和 TASKLET 上

请添加图片描述

每个节点是个tasklet任务,tasklet任务具有如下特点:

  • 相同的类型tasklet被设计成串行执行的,因此不必是可重入的。
  • 同类tasklet不可同时在不同CPU上执行(保证同类串行)
  • 不同类tasklet可以同时在不同CPU上执行。

ksoftirqd内核线程

前面说过,软中断被推迟到设计好的执行点执行,这个执行点就是内核线程 ksoftirqd,Linux为每个CPU都创建的一个ksoftirqd线程3,命名为 ksoftirqd/n,n为cpu逻辑号,ksoftirqd 被定时器周期性唤醒,也会别任意一次中断处理函数的退出流程唤醒(irq_exit())。

从ps命令hanksoftirqd/n

kworker内核线程

这个线程不处理中断,但是,做的工作和 ksoftirqd 相似,都是做延时任务,不同的是,kworker负责的是内核延迟函数,而不是中断延迟函数,另一个不同点是,每个CPU不仅有一个kworker线程,还有一个各自的工作队列,这和tasklet是不同的,tasklet只有固定的两个高低优先级队列。各个工作队列之间如果出现严重不均衡时,kworker还负责调整队列。


  1. 即使是关了中断,在多核处理器上,该中断仍然会被分发到其他CPU执行,因此,如果中断处理函数如果涉及临界数据,仍然需要加锁。 ↩︎

  2. tasklet多被用来编写IO驱动程序。 ↩︎

  3. 从用户的视角看(ps),ksoftirqd 就是一个进程,拥有自己的PID,但是,从内核角度看,所有内核线程都是共享内核地址空间的,我们知道进程的概念需要实现地址空间隔离,并没有把ksoftirqd称为进程,而是线程,其他内核线程也是同样。 ↩︎

  • 20
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值