先介绍下这个案例的背景:在一台机器上,运行了产品A,而后需要增加一些功能,但直接根据A来修改比较麻烦,单独再做一个产品B会更加快捷,也就是说,需要让A和B运行于同一平台。产品A和产品B都包含各自的内核驱动模块,这里分别以M(A)和M(B)指代。
在开发产品B的过程中,发现有时加载M(B)之后,通过"lsmod"命令看到的M(B)的引用计数为0,同时各种奇怪的现象开始出现,比如ssh登录不了啊,查看"/proc/devices"会卡住啊。经过多次试验,确定是在卸载M(A)之后,就会必然出现这个问题,但是单独多次加载、卸载M(A)并不会有问题。
比较有用的信息是syslog里打印的一段back trace:
从call trace可以看到,这是一次open()的系统调用,现在M(B)对应的cdev已经注册成功,在"/dev"目录下也生成了设备节点,可以推断这个操作可能就是在open这个设备,然后在调用tr