作者:刘昊昱
博客:http://blog.csdn.net/liuhaoyutz
编译环境:Ubuntu 10.10
内核版本:2.6.32-38-generic-pae
LDD3源码路径:examples/scull/main.c
本文是对LDD3第三章驱动代码的分析记录。LDD3的scull源码是一个综合性的驱动程序,内容涵盖了第三章到第六章的内容,初学者在学习过程中可能会有一定困难,这里仅分析LDD3第三章涉及的相关代码。在本文的最后,列出了在2.6.32内核上编译scull可能遇到的问题及解决方法。
本文要分析代码位于examples/scull/main.c中。
前面文章中我们曾经介绍过,分析Linux设备驱动程序,起点是找module_init指定的模块初始化函数。所以,我们打开examples/scull/main.c文件,从module_init开始分析。在该文件的672行即是对module_init宏的调用:
672 module_init(scull_init_module);
673 module_exit(scull_cleanup_module);
可见,模块初始化函数是scull_init_module函数。我们找到这个函数的定义:
615int scull_init_module(void)
616{
617 int result, i;
618 dev_t dev = 0;
619
620/*
621 * Get a range of minor numbers to work with, asking for a dynamic
622 * major unless directed otherwise at load time.
623 */
624 if (scull_major) {
625 dev = MKDEV(scull_major, scull_minor);
626 result = register_chrdev_region(dev, scull_nr_devs, "scull");
627 } else {
628 result = alloc_chrdev_region(&dev, scull_minor, scull_nr_devs,
629 "scull");
630 scull_major = MAJOR(dev);
631 }
632 if (result < 0) {
633 printk(KERN_WARNING "scull: can't get major %d\n", scull_major);
634 return result;
635 }
636
637 /*
638 * allocate the devices -- we can't have them static, as the number
639 * can be specified at load time
640 */
641 scull_devices = kmalloc(scull_nr_devs * sizeof(struct scull_dev), GFP_KERNEL);
642 if (!scull_devices) {
643 result = -ENOMEM;
644 goto fail; /* Make this more graceful */
645 }
646 memset(scull_devices, 0, scull_nr_devs * sizeof(struct scull_dev));
647
648 /* Initialize each device. */
649 for (i = 0; i < scull_nr_devs; i++) {
650 scull_devices[i].quantum = scull_quantum;
651 scull_devices[i].qset = scull_qset;
652 init_MUTEX(&scull_devices[i].sem);
653 scull_setup_cdev(&scull_devices[i], i);
654 }
655
656 /* At this point call the init function for any friend device */
657 dev = MKDEV(scull_major, scull_minor + scull_nr_devs);
658 dev += scull_p_init(dev);
659 dev += scull_access_init(dev);
660
661#ifdef SCULL_DEBUG /* only when debugging */
662 scull_create_proc();
663#endif
664
665 return 0; /* succeed */
666
667 fail:
668 scull_cleanup_module();
669 return result;
670}
第624到631行,申请分配设备编号,根据scull_major的值是否为0,分别采用静态分配设备编号(register_chrdev_region)或动态分配设备编号(alloc_chrdev_region)的方法。scull_major代表主设备号,它的值是怎么确定的呢?在main.c的41行有如下定义:
41int scull_major = SCULL_MAJOR;
42int scull_minor = 0;
43int scull_nr_devs = SCULL_NR_DEVS; /* number of bare scull devices */
44int scull_quantum = SCULL_QUANTUM;
45int scull_qset = SCULL_QSET;
46
47module_param(scull_major, int, S_IRUGO);
48module_param(scull_minor, int, S_IRUGO);
49module_param(scull_nr_devs, int, S_IRUGO);
50module_param(scull_quantum, int, S_IRUGO);
51module_param(scull_qset, int, S_IRUGO);
SCULL_MAJOR、SCULL_NR_DEVS、SCULL_QUANTUM、SCULL_QSET这四个宏在scull.h中有定义如下:
44#define SCULL_MAJOR 0 /* dynamic major by default */
48#define SCULL_NR_DEVS 4 /* scull0 through scull3 */
65#define SCULL_QUANTUM 4000
69#define SCULL_QSET 1000
由此可见,scull驱动程序对于scull_major、scull_minor、scull_nr_devs、scull_quantum、scull_qset这几个变量的值采用了赋默认值,但同时也保留用户在命令行通过模块参数进行设置的可能。以scull_major为例,其默认值是0,在scull_init_module函数中,如果用户没有通过命令行参数给scull_major赋任意大于0的值,则会采用alloc_chrdev_region动态分配设备编号。如果用户给scull_major赋了一个大于0值,则采用register_chrdev_region静态申请设备编号。
我们继续看scull_init_module函数。下面看641行:
641 scull_devices = kmalloc(scull_nr_devs * sizeof(struct scull_dev), GFP_KERNEL);
642 if (!scull_devices) {
643 result = -ENOMEM;
644 goto fail; /* Make this more graceful */
645 }
646 memset(scull_devices, 0, scull_nr_devs * sizeof(struct scull_dev));
给scull_nr_devs个scull设备分配内存空间,并将分配得到的内存清0。scull_nr_devs默认值为4,即默认创建4个scull设备(scull0 - scull3),每个scull设备由scull_dev结构体表示,其定义在scull.h文件中:
87struct scull_dev {
88 struct scull_qset *data; /* Pointer to first quantum set */
89 int quantum; /* the current quantum size */
90 int qset; /* the current array size */
91 unsigned long size; /* amount of data stored here */
92 unsigned int access_key; /* used by sculluid and scullpriv */
93 struct semaphore sem; /* mutual exclusion semaphore */
94 struct cdev cdev; /* Char device structure */
95};
scull_dev结构体的每个成员,我们用到时再解释其含义。继续看scull_init_module函数。下面看649行:
649 for (i = 0; i < scull_nr_devs; i++) {
650 scull_devices[i].quantum = scull_quantum;
651 scull_devices[i].qset = scull_qset;
652 init_MUTEX(&scull_devices[i].sem);
653 scull_setup_cdev(&scull_devices[i], i);
654 }
因为我们分配了scull_nr_devs个scull_dev结构体,即创建了scull_nr_devs个scull设备,所以这里用for循环对前面创建scull设备进行初始化,共循环scull_nr_devs次,每次循环完成对一个scull设备的初始化。
scull_devices[i].quantum代表scull设备当前“量子”大小,这里赋值为scull_quantum,其默认值为4000。scull_devices[i].qset代表当前数组大小,这里赋值为scull_qset,其默认值为1000。调用init_MUTEX对每个scull设备的sem成员进行初始化,这是一个互斥体,用于保证对scull设备的互斥访问,这是第5章的内容,这里不详细介绍。
在每次循环的最后,调用了scull_setup_cdev函数对相应scull设备进行设置。我们来看这个函数的完成了什么工作:
598/*
599 * Set up the char_dev structure for this device.
600 */
601static void scull_setup_cdev(struct scull_dev *dev, int index)
602{
603 int err, devno = MKDEV(scull_major, scull_minor + index);
604
605 cdev_init(&dev->cdev, &scull_fops);
606 dev->cdev.owner = THIS_MODULE;
607 dev->cdev.ops = &scull_fops;
608 err = cdev_add (&dev->cdev, devno, 1);
609 /* Fail gracefully if need be */
610 if (err)
611 printk(KERN_NOTICE "Error %d adding scull%d", err, index);
612}
scull_setup_cdev函数完成对scull设备的cdev成员变量(struct cdev类型)的初始化和注册。cdev结构体在内核中代表一个字符设备。
603行,调用MKDEV宏得到设备编号,注意,4个scull设备的主设备号都是一样的,但次设备号分别是0 - 3。
605行,调用cdev_init函数对cdev结构体进行初始化,指定对应的文件操作函数集是scull_fops,这个scull_fops必须是前面已经定义实现好的。这个是我们后面介绍的重点。
606行指定所有者是THIS_MODULE。
607行是多余的,因为在605行已经指定了文件操作函数集是scull_fops。
608行,调用cdev_add函数将cdev结构体注册到内核,注册成功后,相应的scull设备就“活”了,其它程序就可以访问scull设备的资源。所以在注册之前,必须确保所有必要的初始化工作都完成了。
经过前面的步骤,scull设备初始化工作就完成了,并将相应的cdev结构体注册给内核。下面我们再次回到scull_init_module函数,现在代码执行到657行:
657 dev = MKDEV(scull_major, scull_minor + scull_nr_devs);
658 dev += scull_p_init(dev);
659 dev += scull_access_init(dev);
660
661#ifdef SCULL_DEBUG /* only when debugging */
662 scull_create_proc();
663#endif
664
665 return 0; /* succeed */
666
667 fail:
668 scull_cleanup_module();
669 return result;
657 - 664行是第4 - 6章相关的代码,这里不做讨论。所以,如果成功,scull_init_module函数就在665行返回0.
667 - 669行,如果前面的执行出现问题,清理已经分配的资源并返回错误信息。
现在scull设备的模块初始化函数就全部结束了。scull驱动程序已经被注册在内核中,该驱动程序不会主动做任何事情,而是等待响应用户程序的访问。我们应该知道,在用户空间,在用户程序看来,设备和其它普通文件一样,都是文件,而操作这些文件的接口就是文件操作函数集,比如open,read,write等等。
如果用户空间程序通过open,read,write等函数操作设备文件,驱动程序应该做什么样的响应呢?我们在注册scull设备的cdev时,指定了设备文件操作函数集
605 cdev_init(&dev->cdev, &scull_fops);
而scull_fops就指定了如果用户空间程序执行open,read,write操作,应该调用什么函数进行响应。scull_fops定义如下:
551struct file_operations scull_fops = {
552 .owner = THIS_MODULE,
553 .llseek = scull_llseek,
554 .read = scull_read,
555 .write = scull_write,
556 .ioctl = scull_ioctl,
557 .open = scull_open,
558 .release = scull_release,
559};
通过scull_fops,内核就知道了,如果用户空间程序调用 open操作打开scull相应设备,内核就会执行scull驱动程序的scull_open函数进行响应。其它函数依次类推。如果驱动程序没有定义对应某个用户空间操作的函数,内核就会执行默认动作响应。
在scull_fops结构体中,与第3章相关的是scull_open,scull_read,scull_write,scull_release的实现。下面我们依次来看这几个函数如何响应用户空间的对应操作。
在继续分析之前,我们先来看scull设备是怎么利用内存的,如下图所示
每个scull设备是一个指针链表,其中每个指针都指向一个scull_qset结构,scull_qset结构在scull.h中定义如下:
82struct scull_qset {
83 void **data;
84 struct scull_qset *next;
85};
每个scull_qset通过一个中间指针数组最多可引用4000000个字节。因为scull.c中,默认情况下,每个指针数组有SCULL_QSET(1000)个指针,每个指针指向一个SCULL_QUANTUM(4000)字节大小的内存区域。每个内存区域称为一个量子(大小为4000字节),而这个指针数组,称为量子集。
下面我们先来看scull_open函数:
238int scull_open(struct inode *inode, struct file *filp)
239{
240 struct scull_dev *dev; /* device information */
241
242 dev = container_of(inode->i_cdev, struct scull_dev, cdev);
243 filp->private_data = dev; /* for other methods */
244
245 /* now trim to 0 the length of the device if open was write-only */
246 if ( (filp->f_flags & O_ACCMODE) == O_WRONLY) {
247 if (down_interruptible(&dev->sem))
248 return -ERESTARTSYS;
249 scull_trim(dev); /* ignore errors */
250 up(&dev->sem);
251 }
252 return 0; /* success */
253}
242行,调用container_of宏,通过cdev成员得到包含该cdev的scull_dev结构。
243行,将得到的scull_dev结构保存在filp->private_data中,因为open结束后,后面的read,write等操作使用同一个filp变量,它们即可以从filp->private_data中直接取出scull_dev结构体来使用。
246 - 251行,如果scull设备文件是以只写的方式打开,则要调用scull_trim将scull设备清空。247和250行是进行加锁解锁操作,进行互斥。这里不讨论。
下面看scull_trim函数是怎样清空scull设备的:
59/*
60 * Empty out the scull device; must be called with the device
61 * semaphore held.
62 */
63int scull_trim(struct scull_dev *dev)
64{
65 struct scull_qset *next, *dptr;
66 int qset = dev->qset; /* "dev" is not-null */
67 int i;
68
69 for (dptr = dev->data; dptr; dptr = next) { /* all the list items */
70 if (dptr->data) {
71 for (i = 0; i < qset; i++)
72 kfree(dptr->data[i]);
73 kfree(dptr->data);
74 dptr->data = NULL;
75 }
76 next = dptr->next;
77 kfree(dptr);
78 }
79 dev->size = 0;
80 dev->quantum = scull_quantum;
81 dev->qset = scull_qset;
82 dev->data = NULL;
83 return 0;
84}
66行,qset = dev->qset; dev->qset的值为1000,即量子集的大小。
69行,dptr = dev->data; dev->data指向第一个量子集scull_qset。所以这个for循环每次循环处理一个scull_qset。
71行,这个for循环循环1000次,因为每个量子集有1000个量子。
72行,每次kfree释放一个量子的内存空间。
73行,释放量子集数组占用的内存空间。
74行,将指针重新初始化为NULL。防止野指针。
76行,next指向下一个量子集。
77行,释放scull_qset占用的内存空间。
79 - 82行,恢复初始状态。
下面我们看scull_release函数的实现:
255int scull_release(struct inode *inode, struct file *filp)
256{
257 return 0;
258}
这个函数直接返回0。因为scull设备是内存设备,关闭设备时也没有什么需要特别清理的。所以这个函数比较简单。
下面我们看scull_read函数的实现:
292ssize_t scull_read(struct file *filp, char __user *buf, size_t count,
293 loff_t *f_pos)
294{
295 struct scull_dev *dev = filp->private_data;
296 struct scull_qset *dptr; /* the first listitem */
297 int quantum = dev->quantum, qset = dev->qset;
298 int itemsize = quantum * qset; /* how many bytes in the listitem */
299 int item, s_pos, q_pos, rest;
300 ssize_t retval = 0;
301
302 if (down_interruptible(&dev->sem))
303 return -ERESTARTSYS;
304 if (*f_pos >= dev->size)
305 goto out;
306 if (*f_pos + count > dev->size)
307 count = dev->size - *f_pos;
308
309 /* find listitem, qset index, and offset in the quantum */
310 item = (long)*f_pos / itemsize;
311 rest = (long)*f_pos % itemsize;
312 s_pos = rest / quantum; q_pos = rest % quantum;
313
314 /* follow the list up to the right position (defined elsewhere) */
315 dptr = scull_follow(dev, item);
316
317 if (dptr == NULL || !dptr->data || ! dptr->data[s_pos])
318 goto out; /* don't fill holes */
319
320 /* read only up to the end of this quantum */
321 if (count > quantum - q_pos)
322 count = quantum - q_pos;
323
324 if (copy_to_user(buf, dptr->data[s_pos] + q_pos, count)) {
325 retval = -EFAULT;
326 goto out;
327 }
328 *f_pos += count;
329 retval = count;
330
331 out:
332 up(&dev->sem);
333 return retval;
334}
295 - 300行,进行必要的初始化。
302行,获得互斥锁。
310行,item = (long)*f_pos / itemsize; item代表要读的数据起始点在哪个scull_qset中。
311行,rest = (long)*f_pos % itemsize; rest是一个中间值。在312行使用。
312行,s_pos = rest / quantum; q_pos = rest % quantum; s_pos代表要读的数据起始点在哪个量子中。q_pos代表要读的数据的起始点在量子的具体哪个位置。
315行,dptr = scull_follow(dev, item);调用scull_follow函数,这个函数的第二个参数代表要读的数据在哪个scull_qset中,该函数的作用是返回item指定的scull_qset。如果scull_qset不存在,还要分配内存空间,创建指定的scull_qset。下面看scull_follow函数的实现:
262struct scull_qset *scull_follow(struct scull_dev *dev, int n)
263{
264 struct scull_qset *qs = dev->data;
265
266 /* Allocate first qset explicitly if need be */
267 if (! qs) {
268 qs = dev->data = kmalloc(sizeof(struct scull_qset), GFP_KERNEL);
269 if (qs == NULL)
270 return NULL; /* Never mind */
271 memset(qs, 0, sizeof(struct scull_qset));
272 }
273
274 /* Then follow the list */
275 while (n--) {
276 if (!qs->next) {
277 qs->next = kmalloc(sizeof(struct scull_qset), GFP_KERNEL);
278 if (qs->next == NULL)
279 return NULL; /* Never mind */
280 memset(qs->next, 0, sizeof(struct scull_qset));
281 }
282 qs = qs->next;
283 continue;
284 }
285 return qs;
286}
scull_follow函数的作用是返回第二个参数指定的scull_qset。如果该scull_qset不存在,分配内存空间创建该scull_qset。
我们再返回到scull_read函数中,代码现在运行到了317行:
317 if (dptr == NULL || !dptr->data || ! dptr->data[s_pos])
318 goto out; /* don't fill holes */
如果指定的scull_qset不存在,或者量子指针数组不存在,或者量子不存在,都退出。
321 - 322行,设置scull_read一次最多只能读一个量子。
320 /* read only up to the end of this quantum */
321 if (count > quantum - q_pos)
322 count = quantum - q_pos;
324行,调用copy_to_user(buf, dptr->data[s_pos] + q_pos, count)函数,将数据拷贝到用户空间。
328行,*f_pos += count;读取完成后,新的文件指针位置向前移动count个字节。
329 行,retval = count;返回读取到的字节数,即count。
最后,我们来分析scull_write函数:
336ssize_t scull_write(struct file *filp, const char __user *buf, size_t count,
337 loff_t *f_pos)
338{
339 struct scull_dev *dev = filp->private_data;
340 struct scull_qset *dptr;
341 int quantum = dev->quantum, qset = dev->qset;
342 int itemsize = quantum * qset;
343 int item, s_pos, q_pos, rest;
344 ssize_t retval = -ENOMEM; /* value used in "goto out" statements */
345
346 if (down_interruptible(&dev->sem))
347 return -ERESTARTSYS;
348
349 /* find listitem, qset index and offset in the quantum */
350 item = (long)*f_pos / itemsize;
351 rest = (long)*f_pos % itemsize;
352 s_pos = rest / quantum; q_pos = rest % quantum;
353
354 /* follow the list up to the right position */
355 dptr = scull_follow(dev, item);
356 if (dptr == NULL)
357 goto out;
358 if (!dptr->data) {
359 dptr->data = kmalloc(qset * sizeof(char *), GFP_KERNEL);
360 if (!dptr->data)
361 goto out;
362 memset(dptr->data, 0, qset * sizeof(char *));
363 }
364 if (!dptr->data[s_pos]) {
365 dptr->data[s_pos] = kmalloc(quantum, GFP_KERNEL);
366 if (!dptr->data[s_pos])
367 goto out;
368 }
369 /* write only up to the end of this quantum */
370 if (count > quantum - q_pos)
371 count = quantum - q_pos;
372
373 if (copy_from_user(dptr->data[s_pos]+q_pos, buf, count)) {
374 retval = -EFAULT;
375 goto out;
376 }
377 *f_pos += count;
378 retval = count;
379
380 /* update the size */
381 if (dev->size < *f_pos)
382 dev->size = *f_pos;
383
384 out:
385 up(&dev->sem);
386 return retval;
387}
339 - 344行,完成必要的初始化工作。
346行,取得互斥锁。
350行,item = (long)*f_pos / itemsize; item代表要写入的位置在哪个scull_qset中。
351行,rest = (long)*f_pos % itemsize; rest中一个中间值,在352行用到它。
352行,s_pos = rest / quantum; q_pos = rest % quantum; s_pos代表要写入的位置在哪个量子中,q_pos代表要写入的位置在量子的具体位置。
355行,dptr = scull_follow(dev, item);调用scull_follow函数,返回item指定的scull_qset。scull_follow函数在前面分析scull_read函数时已经分析过了。
358 - 363行,如果指定的量子指针数组不存在,则分配内存空间,创建量子指针数组。
364 - 368行,如果指定量子不存在,则分配内存空间,创建量子。
370 - 371行,限定一次最多只能写满一个量子。
373行,调用copy_from_user,将用户数据写到量子中。
377行,将文件指针后移count字节。
378行,设置返回值为count,即写入字节数。
382行,更新文件大小。
至此,LDD3第三章相关的源码我们就都分析完了。
在我的系统上(2.6.32-38-generic-pae),编译scull代码时,遇到如下图所示错误:
解决办法是将Makefile的第12行,13行,38行的CFLAGS替换为EXTRA_CFLAGS即可。但是再执行make,又出现另一个错误如下图所示:
只要把main.c第17行的#include <linux/config.h>屏蔽掉即可解决这个问题。但是再执行make,又出现如下图所示问题:
在pipe.c文件中加入如下语句:#include <linux/sched.h>即可解决,再次make,又出现如下图所示错误:
在access.c文件中加入如下语句:#include <linux/sched.h>,再次make,又出现如下图所示错误:
task_struct结构体在iclude/linux/sched.h中定义,这个错误因为task_struct结构体有改动,将uid和euid等变量挪到了cred中,cred结构体定义在include/linux/cred.h中,这个头文件已经在include/linux/sched.h中包含。所以,需要将报错的代码做如下修改:
current->uid改为current->cred->uid
current->euid改为current->cred->euid
再次make,编译通过,如下图所示:
安装/卸载scull模块使用LDD3源码中自带的scull_load和scull_unload脚本。如下图所示:(注意,在我的系统上,我修改了scull_load文件的第5行,将mode设置为”666”,否则当往/dev/scull0写入数据时会提示没有操作权限。)
测试scull测试如下图所示: