list.h头文件分析

最新推荐文章于 2023-09-24 23:13:47 发布

xuexingyang

最新推荐文章于 2023-09-24 23:13:47 发布

阅读量3.5k

点赞数

分类专栏： Linux/Unix ABC 文章标签： list struct each 数据结构测试 linux

Linux/Unix ABC 专栏收录该内容

22 篇文章 2 订阅

订阅专栏

序：觉得这哥们写的不错，再转来给大家看。

双链表的应用在内核中随处可见，list.h头文件集中定义了双链表（struct list_head结构体）的相关操作。比如这里的一个头文件中就有大量的struct list_head型的数据。

关于list.h的分析，网上资料很多，这里只是记录我在分析list.h中遇到的问题。

0.struct list_head结构体

可能这样写，更让我们习惯：

 
   1struct list_head {
 
   2struct list_head *next;
 
   3struct list_head *prev;
 
   4};

这个结构经常作为成员与其他数据类型一起组成一个新的结构体（后文若无特别提示，“新结构体”均指类似下面举例的嵌套型结构体），比如:

 
   1struct stu
 
   2{
 
   3    char name[20];
 
   4    int id;
 
   5    struct list_head list;
 
   6}

我们已经看到，struct list_head这个结构比较特殊，它内部没有任何数据，只是起到链接链表的作用。对于它当前所在的这个结点来说，next指向下一个结点，prev指向上一个结点。通常我们通过指向struc list_head的指针pos来获取它所在结点的地址，尽而获取其他数据。也许你现在还比较困惑这一过程，别着急，后面有特别解释。

1.链表的初始化

其实可以从后往前看，这样更容易理解。INIT_LIST_HEAD函数形成一个空链表。这个list变量一般作为头指针（非头结点）。

 
   128static inline void INIT_LIST_HEAD(struct list_head *list)
 
   229{
 
   330        list->next = list;
 
   431        list->prev = list;
 
   532}

下面的宏生成一个头指针name，如何生成？请看LIST_HEAD_INIT(name)。

 
   125#define LIST_HEAD(name) /
 
   226        struct list_head name = LIST_HEAD_INIT(name)

LIST_HEAD_INIT(name)将name的地址直接分别赋值给next和prev，那么它们事实上都指向自己，也形成一个空链表。现在再回头看宏LIST_HEAD(name)，它其实就是一个定义并初始化作用。

`1`	`23#define LIST_HEAD_INIT(name) { &(name), &(name) }`

3.添加元素

这两个函数分别给链表头结点后，头结点前添加元素。前者可实现栈的添加元素，后者可实现队列的添加元素。
static inline void list_add(struct list_head *new, struct list_head *head);
static inline void list_add_tail(struct list_head *new, struct list_head *head);

这两个函数如何实现的？它们均调用的下面函数：

 
   141static inline void __list_add(struct list_head *new,
 
   242                              struct list_head *prev,
 
   343                              struct list_head *next)
 
   444{
 
   545        next->prev = new;
 
   646        new->next = next;
 
   747        new->prev = prev;
 
   848        prev->next = new;
 
   949}

现在我们要关注的是，list_add和list_add_tail两函数在调用__list_add函数时，对应的各个参数分别是什么？通过下面所列代码，我们可以发现这里的参数运用的很巧妙，类似JAVA中的封装。

 
   164static inline void list_add(struct list_head *new, structlist_head *head)
 
   265{
 
   366        __list_add(new, head, head->next);
 
   467}
 
   5 
 
   678static inline void list_add_tail(struct list_head *new, structlist_head *head)
 
   779{
 
   880        __list_add(new, head->prev, head);
 
   981}

注意，这里的形参prev和next是两个连续的结点。这其实是数据结构中很普通的双链表元素添加问题，在此不再赘述。下面的图可供参考，图中1～4分别对应__list_add函数的四条语句。

3.删除元素

这里又是一个调用关系，__list_del函数具体的过程很简单，分别让entry节点的前后两个结点（prev和next）“越级”指向彼此。请注意这个函数的后两句话，它属于不安全的删除。

 
   1103static inline void list_del(struct list_head *entry)
 
   2104{
 
   3105        __list_del(entry->prev, entry->next);
 
   4106        entry->next = LIST_POISON1;
 
   5107        entry->prev = LIST_POISON2;
 
   6108}

想要安全的删除，那么可以调用下面函数。还记得INIT_LIST_HEAD(entry)吗，它可以使entry节点的两个指针指向自己。

 
   1140static inline void list_del_init(struct list_head *entry)
 
   2141{
 
   3142        __list_del(entry->prev, entry->next);
 
   4143        INIT_LIST_HEAD(entry);
 
   5144}

4.替换元素

用new结点替换old结点同样很简单，几乎是在old->prev和old->next两结点之间插入一个new结点。画图即可理解。

 
   1120static inline void list_replace(struct list_head *old,
 
   2 121                                struct list_head *new)
 
   3 122{
 
   4 123        new->next = old->next;
 
   5 124        new->next->prev = new;
 
   6 125        new->prev = old->prev;
 
   7 126        new->prev->next = new;
 
   8 127}

同样，想要安全替换，可以调用：

 
   1129static inline void list_replace_init(struct list_head *old,
 
   2130                                        struct list_head *new)
 
   3131{
 
   4132        list_replace(old, new);
 
   5133        INIT_LIST_HEAD(old);
 
   6134}

5.移动元素

理解了删除和增加结点，那么将一个节点移动到链表中另一个位置，其实就很清晰了。list_move函数最终调用的是__list_add(list,head,head->next)，实现将list移动到头结点之后；而list_move_tail函数最终调用__list_add_tail(list,head->prev,head)，实现将list节点移动到链表末尾。

 
   01151static inline void list_move(struct list_head *list, structlist_head *head)
 
   02152{
 
   03153        __list_del(list->prev, list->next);
 
   04154        list_add(list, head);
 
   05155}
 
   06156
 
   07 
 
   08162static inline void list_move_tail(struct list_head *list,
 
   09163                                  struct list_head *head)
 
   10164{
 
   11165        __list_del(list->prev, list->next);
 
   12166        list_add_tail(list, head);
 
   13167}

6.测试函数

接下来的几个测试函数，基本上是“代码如其名”。

list_is_last函数是测试list是否为链表head的最后一个节点。

 
   1174static inline int list_is_last(const struct list_head *list,
 
   2175                                const struct list_head *head)
 
   3176{
 
   4177        return list->next == head;
 
   5178}

下面的函数是测试head链表是否为空链表。注意这个list_empty_careful函数，他比list_empty函数“仔细”在那里呢？前者只是认为只要一个结点的next指针指向头指针就算为空，但是后者还要去检查头节点的prev指针是否也指向头结点。另外，这种仔细也是有条件的，只有当其他cpu的链表操作只有list_del_init()时，否则仍然不能保证安全。

 
   01184static inline int list_empty(const struct list_head *head)
 
   02185{
 
   03186        return head->next == head;
 
   04187}
 
   05 
 
   06202static inline int list_empty_careful(const struct list_head *head)
 
   07203{
 
   08204        struct list_head *next = head->next;
 
   09205        return (next == head) && (next == head->prev);
 
   10206}

下面的函数是测试head链表是否只有一个结点：这个链表既不能是空而且head前后的两个结点都得是同一个结点。

 
   1226static inline int list_is_singular(const struct list_head *head)
 
   2227{
 
   3228        return !list_empty(head) && (head->next == head->prev);
 
   4229}

7.将链表左转180度

正如注释说明的那样，此函数会将这个链表以head为转动点，左转180度。整个过程就是将head后的结点不断的移动到head结点的最左端。如果是单个结点那么返回真，否则假。

 
   1212static inline void list_rotate_left(struct list_head *head)
 
   2213{
 
   3214        struct list_head *first;
 
   4215
 
   5216        if (!list_empty(head)) {
 
   6217                first = head->next;
 
   7218                list_move_tail(first, head);
 
   8219        }
 
   9220}

上述函数每次都调用 list_move_tail(first, head);其实我们将其分解到“最小”，那么这个函数每次最终调用的都是：__list_del(first->prev,first->next);和__list_add(list,head->prev,head);这样看起来其实就一目了然了。

8.将链表一分为二

这个函数是将head后至entry之间（包括entry）的所有结点都“切开”，让他们成为一个以list为头结点的新链表。我们先从宏观上看，如果head本身是一个空链表则失败；如果head是一个单结点链表而且entry所指的那个结点又不再这个链表中，也失败；当entry恰好就是头结点，那么直接初始化list，为什么？因为按照刚才所说的切割规则，从head后到entry前事实上就是空结点。如果上述条件都不符合，那么就可以放心的“切割”了。

 
   01257static inline void list_cut_position(struct list_head *list,
 
   02258                struct list_head *head, struct list_head *entry)
 
   03259{
 
   04260        if (list_empty(head))
 
   05261                return;
 
   06262        if (list_is_singular(head) &&
 
   07263                (head->next != entry && head != entry))
 
   08264                return;
 
   09265        if (entry == head)
 
   10266                INIT_LIST_HEAD(list);
 
   11267        else
 
   12268                __list_cut_position(list, head, entry);
 
   13269}

具体如何切割，这里的代码貌似很麻烦，可是我们画出图后，就“一切尽在不言中”了。

 
   01231static inline void __list_cut_position(struct list_head *list,
 
   02232                struct list_head *head, struct list_head *entry)
 
   03233{
 
   04234        struct list_head *new_first = entry->next;
 
   05235        list->next = head->next;
 
   06236        list->next->prev = list;
 
   07237        list->prev = entry;
 
   08238        entry->next = list;
 
   09239        head->next = new_first;
 
   10240        new_first->prev = head;
 
   11241}

图示：

9.合并链表

既然我们可以切割链表，那么当然也可以合并了。先看最基本的合并函数，就是将list这个链表（不包括头结点）插入到prev和next两结点之间。这个代码阅读起来不困难，基本上是“见码知意”。

 
   01271static inline void __list_splice(const struct list_head *list,
 
   02272                                 struct list_head *prev,
 
   03273                                 struct list_head *next)
 
   04274{
 
   05275        struct list_head *first = list->next;
 
   06276        struct list_head *last = list->prev;
 
   07277
 
   08278        first->prev = prev;
 
   09279        prev->next = first;
 
   10280
 
   11281        last->next = next;
 
   12282        next->prev = last;
 
   13283}

理解了最基本的合并函数，那么将它封装起来，就可以形成下面两个函数了，分别在head链表的首部和尾部合并。这里的调用过程类似增加，删除功能。

 
   01290static inline void list_splice(const struct list_head *list,
 
   02291                                struct list_head *head)
 
   03292{
 
   04293        if (!list_empty(list))
 
   05294                __list_splice(list, head, head->next);
 
   06295}
 
   07 
 
   08302static inline void list_splice_tail(struct list_head *list,
 
   09303                                struct list_head *head)
 
   10304{
 
   11305        if (!list_empty(list))
 
   12306                __list_splice(list, head->prev, head);
 
   13307}

合并两个链表后，list还指向原链表，因此应该初始化。在上述两函数末尾添加初始化语句INIT_LIST_HEAD(list);后，就安全了。

10.遍历

下面我们要分析链表的遍历。虽然涉及到遍历的宏比较多，但是根据我们前面分析的那样，掌握好最基本的宏，其他宏就是进行“封装”。便利中的基本宏是：

 
   1381#define __list_for_each(pos, head) /
 
   2382        for (pos = (head)->next; pos != (head); pos = pos->next)

head是整个链表的头指针，而pos则不停的往后移动。但是你有没有觉得，这里有些奇怪？因为我们在上篇文章中说过，struct list_head结构经常和其他数据组成新的结构体，那么现在我们只是不停的遍历新结构体中的指针，如何得到其他成员？因此我们需要搞懂list_entry这个宏：

 
   1348#define list_entry(ptr, type, member) /
 
   2349        container_of(ptr, type, member)

这个宏的作用是通过ptr指针获取type结构的地址，也就是指向type的指针。其中ptr是指向member成员的指针。这个list_entry宏貌似很简单的样子，就是再调用container_of宏，可是当你看了container_of宏的定义后……

 
   1443#define container_of(ptr, type, member) ({                      /
 
   2444        const typeof( ((type *)0)->member ) *__mptr = (ptr);    /
 
   3445        (type *)( (char *)__mptr - offsetof(type,member) );})

是不是让人有点抓狂？别急，我们一点点来分析。

首先这个宏包含两条语句。第一条：const typeof( ((type *)0)->member ) *__mptr = (ptr);首先将0转化成type类型的指针变量（这个指针变量的地址为0×0），然后再引用member成员（对应就是((type *)0)->member )）。注意这里的typeof（x），是返回x的数据类型，那么 typeof( ((type *)0)->member )其实就是返回member成员的数据类型。那么这条语句整体就是将__mptr强制转换成member成员的数据类型，再将ptr的赋给它(ptr本身就是指向member的指针)。

第二句中，我们先了解offsetof是什么？它也是一个宏被定义在：linux/include/stddef.h中。原型为：

`1`	`#define offsetof(TYPE, MEMBER) ((size_t) &((TYPE *)0)->MEMBER);`

这个貌似也很抓狂，不过耐心耐心：((TYPE *)0)->MEMBER)这个其实就是提取type类型中的member成员，那么&((TYPE *)0)->MEMBER)得到member成员的地址，再强制转换成size_t类型（unsigned int）。但是这个地址很特别，因为TYPE类型是从0×0开始定义的，那么我们现在得到的这个地址就是member成员在TYPE数据类型中的偏移量。

我们再来看第二条语句， (type *)( (char *)__mptr – offsetof(type,member) )求的就是type的地址，即指向type的指针。不过这里要注意__mptr被强制转换成了(char *)，为何要这么做？因为如果member是非char型的变量，比如为int型，并且假设返回值为offset，那么这样直接减去偏移量，实际上__mptr会减去sizeof(int)*offset！这一点和指针加一减一的原理相同。

有了这个指针，那么就可以随意引用其内的成员了。关于此宏的更具体了解，不妨亲自动手测试这里的程序。

好了，现在不用抓狂了，因为了解了list_entry宏，接下来的事情就很简单了。

下面这个宏会得到链表中第一个结点的地址。

 
   1359#define list_first_entry(ptr, type, member) /
 
   2360        list_entry((ptr)->next, type, member)

真正遍历的宏登场了，整个便利过程看起来很简单，可能你对prefetch()陌生，它的作用是预取节点，以提高速度。

 
   1367#define list_for_each(pos, head) /
 
   2368        for (pos = (head)->next; prefetch(pos->next), pos != (head); /
 
   3369                pos = pos->next)

我们再来看一开始我们举例的那个便利宏。注意它和上述便利宏的区别就是没有prefetch()，因为这个宏适合比较少结点的链表。

 
   1381#define __list_for_each(pos, head) /
 
   2382        for (pos = (head)->next; pos != (head); pos = pos->next)

接下来这个遍历宏貌似长相和上面那几个稍有不同，不过理解起来也不困难，倒着（从最后一个结点）开始遍历链表。

 
   1389#define list_for_each_prev(pos, head) /
 
   2 390        for (pos = (head)->prev; prefetch(pos->prev), pos != (head); /
 
   3 391                pos = pos->prev)

下面两个宏是上述两个便利宏的安全版，我们看它安全在那里？它多了一个与pos同类型的n，每次将下一个结点的指针暂存起来，防止pos被释放时引起的链表断裂。

 
   1399#define list_for_each_safe(pos, n, head) /
 
   2 400        for (pos = (head)->next, n = pos->next; pos != (head); /
 
   3 401                pos = n, n = pos->next)
 
   4 
 
   5 409#define list_for_each_prev_safe(pos, n, head) /
 
   6 410        for (pos = (head)->prev, n = pos->prev; /
 
   7 411             prefetch(pos->prev), pos != (head); /
 
   8 412             pos = n, n = pos->prev)

前面我们说过，用在list_for_each宏进行遍历的时候，我们很容易得到pos，我们都知道pos存储的是当前结点前后两个结点的地址。而通过list_entry宏可以获得当前结点的地址，进而得到这个结点中其他的成员变量。而下面两个宏则可以直接获得每个结点的地址，我们接下来看它是如何实现的。为了方便说明以及便于理解，我们用上文中的结构struct stu来举例。pos是指向struct stu结构的指针；list是一个双链表，同时也是这个结构中的成员，head便指向这个双链表；member其实就是这个结构体中的list成员。

在for循环中，首先通过list_entry来获得第一个结点的地址；&pos->member != (head)其实就是&pos->list!=(head)；它是用来检测当前list链表是否到头了；最后在利用list_entry宏来获得下一个结点的地址。这样整个for循环就可以依次获得每个结点的地址，进而再去获得其他成员。理解了list_for_each_entry宏，那么list_for_each_entry_reverse宏就显而易见了。

 
   1420#define list_for_each_entry(pos, head, member)                          /
 
   2421        for (pos = list_entry((head)->next, typeof(*pos), member);      /
 
   3422             prefetch(pos->member.next), &pos->member != (head);        /
 
   4423             pos = list_entry(pos->member.next, typeof(*pos), member))
 
   5 
 
   6431#define list_for_each_entry_reverse(pos, head, member)                  /
 
   7432        for (pos = list_entry((head)->prev, typeof(*pos), member);      /
 
   8433             prefetch(pos->member.prev), &pos->member != (head);        /
 
   9434             pos = list_entry(pos->member.prev, typeof(*pos), member))

下面这两个宏是从当前结点的下一个结点开始继续（或反向）遍历。

 
   1456#define list_for_each_entry_continue(pos, head, member)                 /
 
   2457        for (pos = list_entry(pos->member.next, typeof(*pos), member);  /
 
   3458             prefetch(pos->member.next), &pos->member != (head);        /
 
   4459             pos = list_entry(pos->member.next, typeof(*pos), member))
 
   5 
 
   6470#define list_for_each_entry_continue_reverse(pos, head, member)         /
 
   7471        for (pos = list_entry(pos->member.prev, typeof(*pos), member);  /
 
   8472             prefetch(pos->member.prev), &pos->member != (head);        /
 
   9473             pos = list_entry(pos->member.prev, typeof(*pos), member))

与上述宏不同的是，这个宏是从当前pos结点开始遍历。

 
   1483#define list_for_each_entry_from(pos, head, member)                     /
 
   2484        for (; prefetch(pos->member.next), &pos->member != (head);      /
 
   3485             pos = list_entry(pos->member.next, typeof(*pos), member))

接下来几个宏又分别是上述几个宏的安全版。安全原因上面已经说过，在此不再赘述。

 
   1list_for_each_entry_safe(pos, n, head, member)
 
   2list_for_each_entry_safe_continue(pos, n, head, member)
 
   3list_for_each_entry_safe_from(pos, n, head, member)
 
   4list_for_each_entry_safe_reverse(pos, n, head, member)

以上即是list.h头文件中的大部分内容分析。关于hash表部分在此暂不分析。

list.h的简单应用

既然我们分析了list.h，那么就要学以致用，因为通过具体的例子我们才能真实感受到双链表的用法。本文首先为你呈现一个最基本的双链表使用方法，然后在引用另外两个例子，大家可以去亲自试试。

1.简单的学生管理系统

这里学生管理系统只是个基本模型：用户输入数据，然后通过输出重定向到stuInfo.txt文件当中。先看学生信息数据结构：

 
   1struct postinfo
 
   2{
 
   3    char id[20];
 
   4    char name[20];
 
   5    char sex[10];
 
   6    char addr[50];
 
   7    char email[20];
 
   8    struct list_head list;
 
   9};

正如我们前面所说的那样，整个双链表是通过struct list_head结构链接起来的，这样我们每次对某个结点的操作，都是先获得list字段的地址，进而通过list_entry宏获得当前结点的地址。

首先，创建头指针。注意我这里说的是头指针，并不是头结点，因此你应该可以理解为什么下面会首先创建一个struct list_head类型的变量，而不是struct postinfo类型的变量。

 
   1struct list_head head;
 
   2INIT_LIST_HEAD(&head);

创建好头指针，我们接下来就去增加学生信息。每次都先生成一个struct postinfo类型的变量tmp，再将每次要增加的信息都暂时保存在此变量中，接着就利用上次我们所说的增加函数：

`1`	`list_add_tail(&(tmp->list),head);`

注意这里我们使用的是&(tmp->list)，正如我们一开始所说的每次对结点的操作实际上都是通过list字段去完成的。

添加完毕后，如何去打印数据？使用我们的遍历宏。pos只是一个struct list_head类型的指针，这个宏会首先使得pos指向head->next，即list链表的第一个结点（而非第一个学生信息结点）。每次移动链表后，通过pos获得当前结点的地址，那么就可以获得其他数据字段的地址了。

 
   1list_for_each(pos,head)
 
   2{
 
   3    pinfo=list_entry(pos,struct postinfo,list);
 
   4    printf("%s %s %s %s %s/n",pinfo->id,pinfo->name,pinfo->sex,pinfo->addr,pinfo->email);
 
   5    }

这个演示程序关键部分就是这样，其他地方只要你有C语言基础，就可以完成的。

2.遍历进程

具体过程请点击这里。

//这里就是下面

#include<linux/init.h> #include<linux/module.h> #include<linux/sched.h> #include<linux/sem.h> #include<linux/list.h> MODULE_LICENSE("Dual BSD/GPL"); static int hello_init(void) { struct task_struct *task,*p; struct list_head *pos; int count=0; printk(KERN_ALERT"Hello World enter begin:/n"); task=&init_task; list_for_each(pos,&task->tasks) { p=list_entry(pos, struct task_struct, tasks); count++; printk(KERN_ALERT"%d--->%s/n",p->pid,p->comm); } printk(KERN_ALERT"the number of process is:%d/n",count); return 0; } static void hello_exit(void) { printk(KERN_ALERT"hello world exit/n"); } module_init(hello_init); module_exit(hello_exit); /*Makefile文件： obj-m :=process.o CURRENT_PATH := $(shell pwd) LINUX_KERNEL := $(shell uname -r) LINUX_KERNEL_PATH := /usr/src/linux-headers-$(LINUX_KERNEL) all: make -C $(LINUX_KERNEL_PATH) M=$(CURRENT_PATH) modules clean: rm -rf .*.cmd *.o *.mod.c *.ko .tmp_versions Module.symvers .Makefile.swp */

前面介绍了内核中的struct list_head结构，list_head结构只是为了服务于其他内核的结构而设计，那
么其他结构如何利用它呢？我在这里用struct task_struct 结构来说明。此结构定义如下（有所省略）：
struct task_struct {
        volatile long state;    /* -1 unrunnable, 0 runnable, >0 stopped */
        void *stack;
        atomic_t usage;
        unsigned int flags;     /* per process flags, defined below */
        unsigned int ptrace;
    .......
        struct list_head tasks;
    .......
    pid_t pid;
        pid_t tgid;
        .....
        char comm[TASK_COMM_LEN];
    .....
};
其中就有list_head型的tasks域，他将内核中所有的进程都连接在一起。这个时候我们就可以利用list_for_each()函数来遍历整个进程项中的tasks。然后再用list_entry()函数找到task_struct的地址，这样就可以打印进程的pid和comm域了。如果不知道这两个宏的意思，可以再看看我前面的文章。

xuexingyang

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
2
评论
list.h头文件分析

序：觉得这哥们写的不错，再转来给大家看。双链表的应用在内核中随处可见，list.h头文件集中定义了双链表（struct list_head结构体）的相关操作。比如这里的一个头文件中就有大量的struct list_head型的数据。关于list.h的分析，网上资料很多，这里只是记录我在分析list.h中遇到的问题。0.struct list_head结构体可能这样写，更让我们习惯：1struct list_head {2struct list_head *next;3struct list_head *pr
复制链接

扫一扫

专栏目录