一、内核中的哈希表
哈希表在内核位置/include/linux/types.h
struct hlist_head {
struct hlist_node *first;
};
struct hlist_node {
struct hlist_node *next, **pprev;
};
今天,我们带着问题去理解Linux内核中的哈希表结构。
1.那么为什么哈希表中头节点hlist_head与其他节点hlist_node不同,而没有采用相同的结构体呢?
因为哈希表中一般采用单散列的形式,并不需要双链表的双向循环功能,所以Linux内核为了减少开销,并没有用hlist_node来指定哈希表头结点,而是采用了hlist_head结构,以减少存储空间的占用。头结点的数量与数据的总量在同一个数量级。
2.为什么在hlist_node中prev采用了二级指针,而没有采用单链表,或双向链表的形式呢?
(1)若使用单链表结构,在插入节点的时候可以采用在哈希表的头结点之后插入节点,此时时间复杂度为O(1)。但在删除节点的时候必须要遍历链表来寻找待删除节点的前一个节点,此时效率较低。
(2)若prev采用一级指针,则链表的形式如下:
为了间接改变表头中hlist_node类型first指针的值,使用了二级指针,因此在node节点中pprev中保存的为前一个结点中第一个元素的地址,头结点中即为first指针,其余节点则为next。
删除一个节点
删除第一个节点的操作方式如下:
*(node1->pprev) = node1->next;
node1->next->pprev = node1->pprev;
删除其余节点的操作方式如下(以node2节点为例):
*(node2->pprev) = node2->next;
node2->next->pprev = node2->pprev;
插入第一个节点:
node1->pprev = &(my_list->first);
node1->next = my_list->first;//初始化时,first指针指向NULL
mylist->first = node1;
插入其余节点(以node2为例):
头插法
node2->pprev = &(my_list->first);
node2->next = my_list->first; // 或node1,为了与插入第一个节点的操作保持一致
my_list->first = node2;
尾插法
node2->pprev = &(node1->next);
node2->next = node1->next;
node1->next = node2;
这样一来所有节点的删除和插入操作方式都是完全一样的。
哈希表中的宏定义
//初始化头结点
#define HLIST_HEAD_INIT { .first = NULL }
//声明并初始化头结点
#define HLIST_HEAD(name) struct hlist_head name = { .first = NULL }
//初始化头结点
#define INIT_HLIST_HEAD(ptr) ((ptr)->first = NULL)
//初始化其他节点
#define INIT_HLIST_NODE(ptr) ((ptr)->next = NULL, (ptr)->pprev = NULL)
其中{ .first = NULL }
这个代码段的作用是,将hlist_head结构体中的first元素初始化为0。是根据结构体中的变量名来区分元素的。
内核中的哈希表结构