[推荐]内核模块编程的详细介绍 from 计算机科学论坛

不知道在什么时候,Linux出现了module这种东西,的确,它是Linux的一大革新。有了 module 之后,写device driver 不再是一项恶梦,修改 kernel也不再是一件痛苦的事了。因为你不需要每次要测试 driver 就重新compile kernel 一次。那简直是会累死人。Module 可以允许我们动态的改变kernel,加载 devicedriver,而且它也能缩短我们 driver development 
的时间。在这篇文章里,我将要跟各位介绍一下 module的原理,以及如何写一个 module。 

 

module
翻译成中文就是模块,不过,事实上去翻译这个字一点都没意义。在讲模块之前,我先举一个例子。相信很多人都用过RedHat。在RedHat里,我们可以执行 sndconfig,它可以帮我们 config 声卡。config完之后如果捉得到你的声卡,那你的声卡马上就可以动了,而且还不用重新激活计算机。这是怎么做的呢? 就是靠module。module其实是一般的程序。但是它可以被动态载到 kernel 里成为kernel的一部分。载到 kernel 里的 module 它具有跟
kernel 一样的权力。可以 access 任何 kernel 的 data structure。你听过kdebug 吗 ? 它是用来debug kernel 的。它就是先将它本身的一个 module 载到 kernel 里,而在user space 的 gdb就可以经由跟这个 module 沟通,得知 kernel 里的 data structure的值,除此之外,还可以经由载到 kernel 的module 去更改 kernel 里 data structure。 

我们知道,在写 C 程序的时候,一个程序只能有一个main。Kernel 本身其实也是一个程序,它本身也有个 main,叫start_kernel()。当我们把一个 module 载到kernel 里的时候,它会跟 kernel 整合在一起,成为 kernel的一部分。请各位想想,那 module 可以有 main 吗 ?答案很明显的,是 No。理由很简单。一个程序只能有一个 main。在使用 module 
时,有一点要记住的是 module是处于被动的角色。它是提供某些功能让别人去使用的。 

Kernel 里有一个变量叫 module_list,每当 user将一个 module 载到 kernel 里的时候,这个 module 就会被记录在module_list 里面。当 kernel要使用到这个 module 提供的 function 时,它就会去 search 这个 list,找到module,然后再使用其提供的function 或 variable。每一个 module 都可以 export 一些 function或变量来让别人使用。除此之外,module 也可以使用已经载到 kernel 里的module 提供的 function。这种情形叫做module stack。比方说,module A 用到 module B 的东西,那在加载 module A之前必须要先加载 moduleB。否则 module A 会无法加载。除了 module 会 export 东西之外,kernel本身也会 export 一些function 或 variable。同样的,module 也可以使用 kernel 所 export出来的东西。由于大家平时都是撰写user space 的程序,所以,当突然去写 module 的时候,会把平时写程序用的function 拿到 module 里使用。像是printf 之类的东西。我要告诉各位的是,module 所使用的 function 或variable,要嘛就是自己写在 module里,要嘛就是别的 module 提供的,再不就是 kernel所提供的。你不能使用一般 libc 或 glibc所提供的function。像 printf之类的东西。这一点可能是各位要多小心的地方。(也许你可以先 link 好,再载到
kernel,我好象试过,但是忘了)

刚才我们说到 kernel 本身会 export 出一些 function 或variable 来让 module 使用,但是,我们不是万能的,我们怎幺知道 kernel有开放那里东西让我们使用呢 ? Linux提供一个 command,叫 ksyms,你只要执行 ksyms -a 就可以知道 kernel或目前载到 kernel 里的 module提供了那些 function 或 variable。底下是我的系统的情形:

c0216ba0 drive_info_R744aa133
c01e4a44 boot_cpu_data_R660bd466
c01e4ac0 EISA_bus_R7413793a
c01e4ac4 MCA_bus_Rf48a2c4c
c010cc34 __verify_write_R203afbeb
. . . . . 

在 kernel 里,有一个 symbol table 是用来记录export 出去的 function 或 variable。除此之外,也会记录着那个 module export 那些function。上面几行中,表示 kernel 提供了 drive_info 这个function/variable。所以,我们可以在kernel 里直接使用它,等载到 kernel 里时,会自动做好 link的动作。由此,我们可以知道,module 本身其实是还没做link 的一些 object code。一切都要等到 module 被加载 kernel 之后,link才会完成。各位应该可以看到drive_info 后面还接着一些奇怪的字符串。_R744aa133,这个字符串是根据目前 
kernel 的版本再做些 encode得出来的结果。为什幺额外需要这一个字符串呢 ? 

Linux 不知道从那个版本以来,就多了一个 config 的选项,叫做Set version number in symbols of module。这是为了避免对系统造成不稳定。我们知道 Linux 的kernel 更新的很快。在 kernel 更新的过程,有时为了效率起见,会对某些旧有的 data structure 或 function
做些改变,而且一变可能有的 variable 被拿掉,有的 function 的 prototype跟原来的都不太一样。如果这种情形发生的时候,那可能以前 2.0.33 版本的module 拿到 2.2.1 版本的 kernel使用,假设原来 module 使用了 2.0.33 kernel 提供的变量叫 A,但是到了2.2.1 由于某些原因必须把 A 都设成NULL。那当此 module 用在 2.2.1 kernel 上时,如果它没去检查 A的值就直接使用的话,就会造成系统的错误。也许不会整个系统都死掉,但是这个 
module 肯定是很难发挥它的功能。为了这个原因,Linux 就在compile module 时,把 kernel 版本的号码 encode 到各个 exported function 和 variable里。 

所以,刚才也许我们不应该讲 kernel 提供了 drive_info,而应该说 kernel 提供了driver_info_R744aa133来让我们使用。这样也许各位会比较明白。也就是说,kernel 认为它提供的driver_info_R744aa133 这个东西,而不是driver_info。所以,我们可以发现有的人在加载 module时,系统都一直告诉你某个 function 无法 resolved。这就是因为 kernel 里没有你要的 function,要不然就是你的module 里使用的 function 跟 kernel encode 的结果不一样。所以无法resolve。解决方式,要嘛就是将kernel 里的 set version 选项关掉,要嘛就是将 module compile 成 kernel有办法接受的型式。 

那有人就会想说,如果 kernel 认定它提供的 function 名字叫做driver_info_R744aa133
的话,那我们写程序时,是不是用到这个 funnction 的地方都改成driver_info_R744aa133 就可以了。答案是Yes。但是,如果每个 function 都要你这样写,你不会觉得很烦吗 ? 比方说,我们在写 driver 时,很多人都会用到 printk这个 function。这是 kernel 所提供的 function。它的功能跟 printf 很像。用法也几乎都一样。是 debug时很好用的东西。如果我们 module 里用了一百次 printk,那是不是我们也要打一百次的 printk_Rdd132261 呢 ?
当然不是,聪明的人马上会想到用 #define printk printk_Rdd132261就好了嘛。所以啰,Linux
很体贴的帮我们做了这件事。 

如果各位的系统有将 set version的选项打开的话,那大家可到 /usr/src/linux/include/linux/modules 这个目录底下。这个目录底下有所多的..ver档案。这些档案其实就是用来做 #define 用的。我们来看看 ksyms.ver 这个档案里,里面有一行是这样子的 : 

#define printk _set_ver(printk) 

set_ver是一个 macro,就是用来在 printk 后面加上 version number 的。有兴趣的朋友可以自行去观看这个 macro的写法。用了这些 ver 檔,我们就可以在 module 里直接使用 printk 
这样的名字了。而这些 ver 档会自动帮我们做好#define 的动作。可是,我们可以发现这个目录有很多很多的 ver 檔。有时候,我们怎幺知道我们要呼叫的 function 是在那个
ver 档里有定义呢 ? Linux 又帮我们做了一件事。/usr/src/linux/include/linux/modversions.h 这个档案已经将全部的 ver 档都加进来了。所以在我们的module 里只要 include 这个档,那名字的问题都解决了。但是,在此,我们奉劝各位一件事,不要将 modversions.h这个档在 module 里 include 进来,如果真的要,那也要加上以下数行: 

#ifdef MODVERSIONS
#include 
#endif 

加入这三行的原因是,避免这个 module 在没有设定 kernel version 的系统上,将 modversions.h 这个档案 include 进来。各位可以去试试看,当你把 set version的选项关掉时,modversions.h 和 modules 这个目录都会不见。如果没有上面三行,那 compile就不会过关。所以一般来讲,modversions.h 我们会选择在 compile 时传给 gcc 使用。就像下面这个样子。 

gcc -c -D__KERNEL__ -DMODULE -DMODVERSIONS main.c 

-include usr/src/linux/include/linux/modversions.h 

在这个 command line 里,我们看到了 -D__KERNEL__,这是说要定义 __KERNEL__ 
这个 constant。很多跟kernel 有关的 header file,都必须要定义这个 constant 才能 include
的。所以建议你最好将它定义起来。另外还有一个 -DMODVERSIONS。这个 constant 我刚才忘了讲。刚才我们说要解决fucntion 或 variable 名字 encode 的方式就是要 include
modversions.h,其实除此之外,你还必须定义 MODVERSIONS 这个 constant。再来就是 MODULE 这个constant。其实,只要是你要写 module 就一定要定义这个变量。而且你还要 include module.h 这个档案,因为_set_ver 就是定义在这里的。 

讲到这里,相信各位应该对 module 有一些认识了,以后遇到 module unresolved 应该不会感到困惑了,应该也有办法解决了。 

刚才讲的都是使用别人的 function 上遇到的名字 encode 问题。但是,如果我们自己的 module 想要 export一些东西让别的 module 使用呢。很简单。在 default 上,在你的 module 
里所有的 global variable 和function 都会被认定为你要 export 出去的。所以,如果你的 module 里有 10 个 global variable,经由ksyms,你可以发现这十个 variable 都会被 export 
出去。这当然是个很方便的事啦,但是,你知道,有时候我们根本不想把所有的variable 都 export 出去,万一有个 module 没事乱改我们的 variable 怎幺办呢 ?
所以,在很多时候,我们都只会限定几个必要的东西 export 出去。在 2.2.1 之前的 kernel (不是很确定) 可以利用register_symtab 来帮我们。但是,现在更新的版本早就出来了。所以,在此,我会介绍 kernel 2.2.1里所提供的。kernel 2.2.1 里提供了一个 macro,叫做 
EXPORT_SYMBOL,这是用来帮我们选择要 export 的variable 或 function。比方说,我要 export 一个叫 full 的 variable,那我只要在 module 里写: 

EXPORT_SYMBOL(full); 

就会自动将 full export 出去,你马上就可以从 ksyms 里发现有 full 这个变量被 export 出去。在使用EXPORT_SYMBOL 之前,要小心一件事,就是必须在 gcc 里定义 EXPORT_SYMTAB 这个 constant,否则在compile 时会发生 parser error。所以,要使用 EXPORT_SYMBOL 的话,那 gcc应该要下: 

gcc -c -D__KERNEL__ -DMODULE -DMODVERSIONS -DEXPORT_SYMTAB 

main.c -include /usr/src/linux/include/linux/modversions.h 

如果我们不想 export 任何的东西,那我们只要在 module 里下 

EXPORT_NO_SYMBOLS; 

就可以了。使用 EXPORT_NO_SYMBOLS 用不着定义任何的 constant。其实,如果各位使用过旧版的register_symbol 的话,一定会觉得新版的方式比较好用。至少我是这样觉得啦。因为使用 register_symbol还要先定义出自己的 symbol_table,感觉有点麻烦。 

当我们使用 EXPORT_SYMBOL 把一些 function 或 variable export 出来之后,我们使用 ksyma -a 去看一些结果。我们发现 EXPORT_SYMBOL(full) 的确是把 full export出来了 : 


c8822200 full [my_module]
c01b8e08 pci_find_slot_R454463b5
. . .


但是,结果怎幺跟我们想象中的不太一样,照理说,应该是 full_Rxxxxxx 之类的东西才对啊,怎幺才出现 full 而已呢 ? 奇怪,问题在那里呢 ? 

其实,问题就在于我们没有对本身的 module 所 export 出来的 function 或 variable 的名字做 encode。想想,如果在 module 的开头。我们加入一行: 


#define full full_Rxxxxxx


之后,我们再重新 compile module 一次,载到 kernel 之后,就可以发现 ksyms -a 显示的是 

c8822200 full_Rxxxxxx [my_module]
c01b8e08 pci_find_slot_R454463b5
. . . . .


了。那是不是说,我们要去对每一个 export 出来的 variable 和 function 做 
define 的动作呢 ?当然不是啰。记得吗,前头我们讲去使用 kernel export 的 function 时,由于 include 了一些 .ver的档案,以致于我们不用再做 define 的动作。现在,我们也要利用 .ver 的档案来帮我们,使我们 module export 出来的function 也可以自动加入 kernel version 的 information。也就是变成 full_Rxxxxxx 之类的东西。 

Linux 里提供了一个 command,叫genksyms,就是用来帮我们产生这种 .ver 的档案的。它会从 stdin 里读取 source code,然后检查 source code 里是否有 export 的 variable 或 function。如果有,它就会自动为每个export 出来的东西产生一些define。这些 define 就是我们之前说的。等我们有了这些 define 之后,只要在我们的 module 里加入这些define,那 export 出来的 function 或 variable 就会变成上面那个样子。 

假设我们的程序都放在一个叫 main.c 档案里,我们可以使用下列的方式产生这些 define。 


gcc -E -D__GENKSYMS__ main.c | genksyms -k 2.2.1 > main.ver


gcc的 -E 参数是指将 preprocessing 的结果 show 出来。也就是说将它 include 的档案,一些 define的结果都展开。-D__GENKSYMS__ 是一定要的。如果没有定义这个 constant,你将不会看到任何的结果。用一个管线是因为genksyms 是从 stdin 读资料的,所以,经由管线将 gcc 的结果传给 genksyms。-k 2.2.1 是指目前使用的kernel 版本是 2.2.1,如果你的 kernel 版本不一样,必须指定你的 kernel 的版本。产生的 define 将会被放到main.ver 里。产生完 main.ver 档之后,在 main.c 里将它 include 进来,那一切就 OK了。有件事要告诉各位的是,使用这个方式产生的 module,其 export 出来的东西会经由 main.ver 的 define改头换面。所以如果你要让别人使用,那你必须将 main.ver 公开,不然,别人就没办法使用你 export 出来的东西了。 

讲了这幺多,相信各位应该都已经比较清楚 module 在 kernel 中是怎幺样一回事,也应该知道为什幺有时候 module会无法加载了。除此之外,各位应该还知道如何使自己 module export 出来的东西也具有 kernel version 的information。 

接下来,要跟各位讲的就是,如何写一个 module 了。其实,写一个 module很简单的。如果你了解我上面所说的东西。那我再讲一次,再用个例子,相信大家就都会了。要写一个 
module,必须要提供两个function。这两个 function 是给 insmod 和 rmmod 使用的。它们分别是 init_module(),以及cleanup_module()。 


int init_module();
void cleanup_module();


相信大家都知道在 Linux 里可以使用 insmod 这个 command 来将某个 module 加载。比方说,我有一个 module 叫hello.o,那使用 insmod hello.o 就可以将 hello 这个 module 载到 kernel 里。观察/etc/modules 应该就可以看到 hello 这个 module 的名字。如果要将 hello 这个 module 移除,则只要使用rmmod hello 就可以了。insmod 在加载 module 之后,就会去呼叫 module 所提供的init_module()。如果传回 0 表示成功,那 module 就会被加载。如果失败,那加载的动作就会失败。一般来讲,我们在init_module() 做的事都是一些初始化的工作。比方说,你的 module 需要一块内存,那你就可以在 init_module() 做kmalloc 的动作。想当然尔。 cleanup_module() 就是在 module要移除的时候做的事。做的事一般来讲就是一些善后的工作,比方像把之前 kmalloc 的内存 free 掉。 

由于 module 是载到 kernel 使用的,所以,可能别的module 会使用你的 module,甚至某些 process 也会使用到你的 module,为了避免 module还有人使用时就被移除,每个 module 都有一个 use  count。用来记录目前有多少个 process 或 module 正在使用这个
module。当 module 的 use count 不等于 0 时,module 是不会被移除掉的。也就是说,当 module 的 use count 不等于 0 时,cleanup_module() 是不会被呼叫的。 

在此,我要介绍三个 macro,是跟 module 的 use count 有关的。 


MOD_INC_USE_COUNT
MOD_DEC_USE_COUNT
MOD_IN_USE


MOD_INC_USE_COUNT
是用来增加 module 的 use count,而 MOD_DEC_USE_COUNT 是用来减少 module 的 use count。至于 MOD_IN_USE 则是用来检查目前这个 module 是不是被使用中。也就是检查 use count 是否为0。module 的 use count 必须由写 module 的人自己来 maintain。系统并不会自动为你把 use count加一或减一。一切都得由自己控制。下面有一个例子,但是,并不会介绍这三个 macro 的使用方法。将来如果有机会,我再来介绍这三个 macro的用法。 

这个例子很简单。其实只是示范如何使用 init_module() 以及 cleanup_module() 来写一个 module。当然,这两个 function 只是构成 module 的基本条件罢了。至于 module 里要提供的功能则是看各人的需要。 

 

main.c
#define MODULE
#include 
#include 
int full;
EXPORT_SYMBOL(full); /* 将 full export 出去 */
int init_module( void )
{
printk( "<5> Module is loadedn" );
return 0;
}
void cleanup_module( void )
{
printk( "<5> Module is unloadedn" );
}


关于 printk 是这样子的,它是 kernel 所提供的一个打印讯息的 function。kernel 有 export 这个function。所以你可以自由的使用它。它的用法跟 printf 几乎一模一样。唯独讯息的开头是<5>,其实,不见得这三个字符啦。也可以是 <4>,<3>,<7>等等的东西。这是代表这个讯息的 prioirty 或 level。 <5> 表示的是跟 KERNEL 有关的讯息。 

main.ver: 

利用 genksyms 产生出来的。 

gcc -E -D__GENKSYMS__ main.c | genksyms -k 2.2.1 > main.ver 

接下来,就是要把 main.c compile 成 main.o 


gcc -D__KERNEL__ -DMODVERSIONS -DEXPORT_SYMTAB -c 
-I/usr/src/linux/include/linux -include 
/usr/src/linux/include/linux/modversions.h 
-include ./main.ver main.c


好了。main.o 已经成功的 compile 出来了,现在下一个 command, 

insmod main.o 

检查看 /proc/modules 里是否有 main 这个 module。如果有,表示 main 这个 module 已经载到 kernel 了。再下一个指令,看看 full export 出去的结果。 


ksyms


结果显示 


Address Symbol Defined by
c40220e0 full_R355b84b2 [main]
c401d04c ne_probe [ne]
c401a04c ei_open [8390]
c401a094 ei_close [8390]
c401a504 ei_interrupt [8390]
c401af1c ethdev_init [8390]
c401af80 NS8390_init [8390]

 

可以看到 full_R355b84b2,表示,我们已经成功的将 full 的名字加上 kernel version 的 information 了。当我们不需要这个 module 时,我们就可以下一个 command, 


rmmod main


这样 main 就会被移除掉了。再检查看看 /proc/modules 就可以发现 main 那一行不见了。各位现在可以看一下 /var/log/message 这个档案,应该可以发现以两行 


Apr 12 14:19:05 host kernel: Module is loaded
Apr 12 14:39:29 host kernel: Module is unloaded


这两行就是 printk 印出来的。 

关于 module 的介绍已经到此告一段落了。其实,使用 module 实在是很简单的一件事。对于要发展 driver 或是增加 kernel 某些新功能的人来讲,用 module 不啻为一个方便的方式。希望这篇文章对各位能有所帮助。

 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值