先介绍下这个案例的背景:在一台机器上,运行了产品A,而后需要增加一些功能,但直接根据A来修改比较麻烦,单独再做一个产品B会更加快捷,也就是说,需要让A和B运行于同一平台。产品A和产品B都包含各自的内核驱动模块,这里分别以M(A)和M(B)指代。
在开发产品B的过程中,发现有时加载M(B)之后,通过"lsmod"命令看到的M(B)的引用计数为0,同时各种奇怪的现象开始出现,比如ssh登录不了啊,查看"/proc/devices"会卡住啊。经过多次试验,确定是在卸载M(A)之后,就会必然出现这个问题,但是单独多次加载、卸载M(A)并不会有问题。
比较有用的信息是syslog里打印的一段back trace:
从call trace可以看到,这是一次open()的系统调用,现在M(B)对应的cdev已经注册成功,在"/dev"目录下也生成了设备节点,可以推断这个操作可能就是在open这个设备,然后在调用try_module_get()进行引用计数加1的时候,由于PTE的内容为0,即访问的虚拟地址没有对应的物理地址,就会触发page fault(异常地址保存在CR2中)。
由于page fault发生在内核态,且属于不可修复的错误,因此将形成Oops。内核oops之后可能还是可以继续运行,但是会出现一些不可预知的结果(比如之前提到的那些现象)。
那为什么会访问到这个地址去呢?比较关键的是这2个函数:
static int chrdev_open(struct inode *inode, struct file *filp){struct cdev *p = inode->i_cdev;if (!p) {struct kobject *kobj;
kobj = kobj_lookup(cdev_map, inode->i_rdev, &idx);
...
}
struct kobject *kobj_lookup(struct kobj_map *domain, dev_t dev, int *index){
struct kobject *kobj;struct probe *p;
retry:for (p = domain->probes[MAJOR(dev) % 255]; p; p = p->next)
...
}