由于C语言中没有“try-catch”机制,所以函数处理过程中的异常情况一般也是借用函数的返回值来通知调用者(caller)。在内核中,我们经常看到ERR_PTR,PTR_ERR,IS_ERR的身影,常见的场景如下:
char *callee() { //如果没有足够的内存,返回内存不足的错误码 if(no sufficient memory) return ERR_PTR(-ENOMEM); //注意,这里在数值前加了一个负号 .... } int caller() { int error = 0; ... from = callee(); //判断返回值是否代表某种类型的错误 if(IS_ERR(from)) //返回对应的错误码 return PTR_ERR(from); .... }
内核中错误码分三部分定义,一部分定义在<linux/error.h>文件中,一部分定义在<asm-generic/errno.h>中,一部分定义在<asm-generic/errno-base.h>中,我们来看看<asm-generic/errno-base.h>中定义的错误码:
#define EPERM 1 /* Operation not permitted */ #define ENOENT 2 /* No such file or directory */ #define ESRCH 3 /* No such process */ #define EINTR 4 /* Interrupted system call */ #define EIO 5 /* I/O error */ #define ENXIO 6 /* No such device or address */ #define E2BIG 7 /* Argument list too long */ #define ENOEXEC 8 /* Exec format error */ #define EBADF 9 /* Bad file number */ #define ECHILD 10 /* Nochild processes */ ...
ERR_PTR,PTR_ERR,IS_ERR为三个内联函数,其定义在<include/linux/err.h>中:
#define MAX_ERRNO 4095 #define IS_ERR_VALUE(x) unlikely((x) >= (unsigned long)-MAX_ERRNO) static inline void* ERR_PTR(long error) { return (void *) error; } static inline long PTR_ERR(const void *ptr) { return (long) ptr; } static inline long IS_ERR(constvoid *ptr) { return IS_ERR_VALUE((unsigned long)ptr); }
为什么函数的定义前要加static修饰符?因为这三个函数被定义在头文件中,头文件将会被多个文件所包含,意即在多个文件中都会有这三个函数的定义,所以要加static修饰,限定函数的作用域在本文件中。
ERR_PTR和PTR_ERR这两个函数比较简单,只是简单的类型转换。
IS_ERR的定义需要分析下:MAX_ERRNO的值为4095,那么(-MAX_ERRNO)的值为(-4095),对应的无符号整型数为0XFFFFF001,即如果某个“地址”(无符号整型)大于等于0XFFFFF001即说明该地址为非正常地址。
诚然,由于错误码不会超过MAX_ERRNO(4095),类似ERR_PTR(-ENOMEM)操作之后得到的“地址”肯定大于0XFFFFF001(比如-1对应的十六进制为0XFFFFFFFF)。但内核的地址空间为3G到4G之间,即区间[0XC0000000, 0XFFFFFFFF],难道内核中的有效地址不会落在区间[0XFFFFF001,0XFFFFFFFF]内?[0XFFFFF001, 0XFFFFFFFF]之间刚好有4K的空间,对应一个Page的大小,难道4G之下的那4K空间,内核不会做地址映射?
最近看了《深入理解linux虚拟内存管理》的部分内容,这本书中对内核空间的布局描述如下:
正如我们所料,在FIXADDR_TOP到4G之间有1个PAGE的GAP。即在4G之下,有1个Page的空洞(地址区间[0XFFFFF001,0XFFFFFFFF]),内核不做任何的地址映射。可见内核正是利用这一点,将出错码“引向”这个空洞,反过来也可以利用这个空洞来判断给定的地址其实是出错码。