基本数据结构和算法在Linux内核中使用

转载 2013年12月03日 09:45:08

基本数据结构和算法在Linux内核中使用

gaufunga day ago

搬运工

Linux内核(源代码的链接在github)

1.链表双向链表无锁链表

2.B+ 树,这是一些你无法在教科书上找到的说明。

一个相对简单的B+树的实现。我把它作为一个学习练习来帮助理解B+树是如何工作的。这同样也被证明是有用的。 ...

一个在教科书中并不常见的技巧。最小的值在右侧而不是在左侧。所有在一个节点里用到的槽都在左侧,所有没有用到的槽包含了空值(NUL)。大多数操作只简单地遍历所有的槽一次并在第一个空值时(NUL)终止。

3.优先排序列表 用于 互斥量、驱动等等。

4.红黑树用于调度、虚拟内存管理、追踪文件描述符和目录项等。

5.区间树

6.树用于内存管理,NFS相关查询和网络相关功能。

根树的一个通用的用处是存储指针到结构页中。

7.优先级堆,如其名称的教科书实现,用于cgroup。

《简单的基于CLR的只插入的,含有指针的定长优先级堆》第七章

8.哈希函数,参考了Knuth和一篇论文。

Knuth建议,用乘法哈希的机器字来表示接近黄金比例的素数的最大整数。Chuck Lever验证了该技术的有效性:

http://www.citi.umich.edu/techreports/reports/citi-tr-00-1.pdf

这些素数的选择是位稀疏的,他们可以通过移位和加法操作,而不必使用乘法器,乘法器是很慢的。

9.有的代码,比如这个驱动,实现了他们自己的哈希函数。 使用了一种旋转哈希算法的哈希函数 Knuth, D. 《计算机程序设计艺术, 卷 3: 排序与搜索》, 第6、7章. Addison Wesley, 1973

10.哈希表用于实现inode、文件系统完整性检测等等。

11.位数组用于处理标志位、中断等等。并在Knuth那本书的卷4中阐述。

12.信号量自旋锁

13.二分查找用于中断处理,寄存器缓存查询等等。

14.B树的二分查找

15.深度优先搜索被广泛地用于目录配置中。

执行一个修改过的命名空间树的深度优先遍历,以指定的start_handle节点开始(及结束)。回调函数会在任何一个参数匹配的节点被发现时被调用。如果回调函数返回了一个非0值,搜索将会立即终止并且将其返回给调用者。

16.广度优先搜索用于检测运行时锁定的正确性。

17.链表中的归并排序用于垃圾收集、文件系统管理等等。

18.冒泡排序在一个驱动库中也有一个令人惊讶的实现。

19.Knuth-Morris-Pratt 字符串匹配,

根据Knuth、Morris和Pratt[1]实现了一个线性时间的字符串匹配算法。他们的算法避免了转换函数的显式地计算DELTA。对于长度为n的文本,其匹配时间是O(n),对于长度为m的模式(pattern),仅使用一个辅助函数PI[1 . .m],预先计算模式的时间为O(m)。数组PI允许转换函数DELTA被实时有效地计算。粗略地说,对于任何状态"q"= 0,1,…、m和在SIGMA中的任何字符"a",PI["q"]的值包含的信息是独立的"a"并需要计算DELTA("q","a") [2]。既然PI只有m个记录,而DELTA有O(m |SIGMA|)个记录,在预处理时间计算PI而不是DELTA的时候,我们可以节省一个因数|SIGMA|

[1] Cormen, Leiserson, Rivest, Stein,算法介绍,第二版,MIT出版社

[2] 见有限自动机原理

20.Boyer-Moore 模式匹配是在找替代品时的参考和建议。

实现了Boyer-Moore字符串匹配算法:

[1] 《一个快速的字符串搜索算法》,R.S. Boyer and Moore.计算机通信协会,20(10), 1977, pp. 762-772.http://www.cs.utexas.edu/users/moore/publications/fstrpos.pdf

[2] 《准确的字符串匹配算法手册》,Thierry Lecroq, 2004 http://www-igm.univ-mlv.fr/~lecroq/string/string.pdf

注:由于Boyer-Moore(BM)从右到左搜索匹配,仍然有可能匹配分布在多个块,在这种情况下该算法并没有优势。

如果你希望确保这样的事情永远不会发生,那使用Knuth-Pratt-Morris(KMP)实现。总之,根据您的设置适当地选择字符串搜索算法。

如果你正在用文本搜索器进行过滤,NIDS或任何类似的注重安全的目的,那么使用KMP。否则,如果你真的关心性能,并且你对数据包进行分类以使用服务质量(QoS)政策,当你不介意匹配可能分布分散,那么用BM。

相关文章推荐

Linux内核常用数据结构要点

简单总结一下Linux Kernel常用数据结构和选取原则
  • ace_an
  • ace_an
  • 2016年12月22日 13:56
  • 889

linux 内核常用数据结构及算法——container_of

container_of是linux内核中常用的一个宏函数,其用途是通过结构体一个yu
  • vah101
  • vah101
  • 2014年11月15日 19:29
  • 1536

Linux C 算法与数据结构 --二叉树

头文件BiTree.h typedef int Item; typedef struct node { struct node * lchild; struct node * rchi...

Linux内核常用数据结构——顺序表之哈希表

一、线性表 线性表按照数据结构的存储形式有分为:顺序表和链式表。 顺序表中数据存储的地址在内存中是连续的,所以可以通过计算地址实现随机存取;如:数组、哈希表等。 链式表中数据存储的地址不一定连续,只能...

linux内核使用的一些算法和思想(个人总结)

这里只罗列一些算法,其中有些在我之前的博文中有所涉及,有些没有,后续有时间再详细分析每一个算法。排名不分先后 1、trie算法,linux网络子系统中取代了之前哈希算法的新路由算法,适合有大...

浅谈linux内核的一些很妙的算法(1)

浅谈linux内核的一些很妙的算法(1) (内核版本是0.11)阅读linux内核时发现了很多难以理解的程序,查找课外书后才发现这些程序的实现算法相当的精妙,不由佩服linus的编程技巧,下面简单说...

Linux系统编程—— fork() 函数详解

需要的头文件: #include #include pid_t fork(void); 功能: 用于从一个已存在的进程中创建一个新进程,新进程称为子进程,原进程称为父进程。 参数: ...

基本数据结构和算法在Linux内核中使用

Linux内核(源代码的链接在github)。 1.链表、双向链表、无锁链表。 2.B+ 树,这是一些你无法在教科书上找到的说明。 一个相对简单的B+树的实现。我把它作为一个学习...
  • nkcxr
  • nkcxr
  • 2014年08月29日 17:16
  • 1005

Linux内核内存管理之SLAB内存管理算法(三) --基本数据结构及slab分配

引进SLAB内存管理算法,BUDDY算法来说,如果要存放很少字节内容而分配一个页,会照成很大的浪费。内存管理引进了SLAB内存管理。...

Linux内核中的一些基本数据结构操作

本文档的Copyleft归yfydz所有,使用GPL发布,可以自由拷贝,转载,转载时请保持文档的完整性,严禁用于任何商业用途。msn:yfydz_no1@hotmail.com来源:http://yf...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:基本数据结构和算法在Linux内核中使用
举报原因:
原因补充:

(最多只允许输入30个字)