2010年05月_yunsongice

12月 11月 10月 09月 08月 06月 05月 04月 03月 02月 01月

原创写时复制

第一代Unix系统实现了一种傻瓜式的进程创建：当发出fork()系统调用时，内核原样复制父进程的整个地址空间并把复制的那一份分配给子进程。这种行为是非常耗时的，因为它需要： - 为子进程的页表分配页框 - 为子进程的页分配页框 - 初始化子进程的页表 - 把父进程的页复制到子进程相应的页中 这种创建地址空间的方法涉及许多内存访问，消耗许多CPU周期，并且完全破坏了高速缓存中的内容。在大多数情况下，这样做常常是毫无意义的，因为许多子进

2010-05-31 20:27:00 3454 5

原创请求调页

上一篇博文引出了“请求调页”技术，术语“请求调页”指的是一种动态内存分配技术，它把页框的分配推迟到不能再推迟为止，也就是说，一直推迟到进程要访问的页不在物理RAM中时为止，由此引起一个缺页异常。 请求调页技术背后的动机是：进程开始运行的时候并不访问其线性地址空间中的全部地址。 事实上，有一部分地址也许永远不被进程使用。此外，程序的局部性原理保证了在程序执行的每个阶段，真正引用的进程页只有一小部分，因此临时用不着的页所在的页框可以由其他进程来使用。因

2010-05-31 20:24:00 3957 1

原创处理地址空间内的错误地址

如果addr地址属于进程的地址空间，则do_page_fault()转到good_area标记处的语句执行： /* * Ok, we have a good vm_area for this memory access, so * we can handle it.. */ good_area: si_code = SEGV_ACCERR; write = 0; switch (error_code &

2010-05-31 20:20:00 4084

原创处理地址空间以外的错误地址

前面博文提到了，如果address不属于进程的地址空间，那么do_page_fault()函数继续执行bad_area标记处的语句。如果错误发生在用户态，则发送一个SIGSEGV信号给current进程并结束函数： /* * Something tried to access memory that isn't in our memory map.. * Fix it, but check if it's kernel or user first..

2010-05-31 20:16:00 2859

原创缺页异常处理程序

我们在中断专题中提到，Linux的缺页（Page Fault）异常处理程序必须区分以下两种情况：由编程错误所引起的异常，及由引用属于进程地址空间但还尚未分配物理页框的页所引起的异常。 线性区描述符可以让缺页异常处理程序非常有效地完成它的工作。do_page_fault()函数是80x86上的缺页中断服务程序，它把引起缺页的线性地址和当前进程的线性区相比较，从而能够根据和下图所示的方案选择适当的方法处理这个异常。 <br

2010-05-31 20:14:00 12583 7

原创释放线性地址区间

内核使用do_munmap()函数从当前进程的地址空间中删除一个线性地址区间。 1 do_munmap()函数 该参数为：进程内存描述符的地址mm，地址区间的起始地址start和它的长度len。要删除的区间并不总是对应一个线性区，它或许是一个线性区的一部分，或许跨越两个或多个线性区。 该函数经过两个主要的阶段。第一阶段（第1一6步），扫描进程所拥有的线性区链表，并把包含在进程地址空间的线性地址区间中的所有线性区从链表中解除链接。第二阶段

2010-05-31 18:49:00 3945 3

原创分配线性地址区间

前面讲了那么多线性区底层分配的细节，现在让我们讨论怎样分配一个新的线性地址区间。为了做到这点，do_mmap()函数为当前进程创建并初始化一个新的线性区。不过，分配成功之后，可以把这个新的线性区与进程已有的其他线性区进行合并。 static inline unsigned long do_mmap(struct file *file, unsigned long addr, unsigned long len, unsigned long prot,

2010-05-31 18:46:00 2600 1

原创线性区的底层处理

在上一篇博文对控制内存处理所用的数据结构和状态信息有了基本理解以后，我们来看一组对线性区描述符进行操作的低层函数。这些函数应当被看作简化了do_map()和do_unmap()实现的辅助函数。这两个函数将在后面的相关博文中进行描述，它们分别扩大或者缩小进程的地址空间。这两个函数所处的层次比我们这里所考虑函数的层次要高一些，它们并不接受线性区描述符作为参数，而是使用一个线性地址区间的起始地址、长度和访问限权作为参数。 1 查找给定地址的最邻近区 find_vma

2010-05-31 18:39:00 2330 2

原创线性区的数据结构

上一篇博文我们会看到，内核使用一种新的资源成功实现了对进程动态内存的推迟分配。当用户态进程请求动态内存时，并没有获得请求的页框，而仅仅获得对一个新的线性地址区间的使用权，而这一线性地址区间就成为进程地址空间的一部分。这一区间就叫做“线性区”。本博，我们就来详细讨论这个线性区。 1 线性区数据结构 Linux通过类型为vm_area_struct的对象实现线性区，它的字段如下所示： struct vm_area_struct { struc

2010-05-31 18:30:00 3629 1

原创内存描述符

在前面的系列博文中我们已经看到，内核中的函数以相当直截了当的方式获得动态内存：__get_free_pages()或alloc_pages()通过伙伴算法从分区页框分配器中获得页框，kmem_cache_alloc()或kmalloc()使用slab分配器为专用或通用对象分配内存，而vmalloc()或vmalloc_32()获得一块非连续的内存区。如果所请求的内存区得以满足，这些函数都返回一个页描述符或线性地址（即所分配动态内存区的起始地址）。 使用这些简单方法是基于以

2010-05-31 16:37:00 3565

原创内核同步与互斥的总结

前面讲了那么多内核同步与互斥的技术，现在我们就来做一个总结。我们可以随意使用前面所述的同步技术保护共享数据结构避免竞争条件。当然，系统性能可能随所选择同步原语种类的不同而有很大变化。通常情况下，内核开发者采用下述由经验得到的法则：把系统中的并发度保持在尽可能高的程度。系统中的并发度又取决于两个主要因素：（1）同时运转的I/O设备数（2）进行有效工作的CPU数为了使I/O吞吐量最大化，应该使中断禁止保持在很短的时间。因为，当中断被禁止时，由I/O设备产生的IRQ被PIC暂时忽略，因此，就没

2010-05-31 15:34:00 2220

原创一些避免竞争条件的实例

人们总是期望内核开发者确定和解决由内核控制路径的交错执行所引起的同步问题。但是，避免竞争条件是一项艰巨的任务，因为这需要对内核的各个成分如何相互作用有一个清楚的理解。为了直观地认识内核内部到底是什么样子，需要提及前面博文中所定义同步技术的几种典型应用场景。 1 引用计数器 引用计数器广泛地用在内核中以避免由于资源的并发分配和释放而产生的竞争条件。引用计数器（reference counter）只不过是一个atomic_t计数器，与特定的资源，如内存页、模块或文

2010-05-31 14:51:00 1679

原创禁止本地中断

禁止本地CPU中断是确保一组内核语句被当作一个临界区处理的主要机制。这个机制的意义是：即使当硬件设备产生了一个IRQ信号时，中断禁止也让内核控制路径继续执行，因此，这就提供了一种有效的方式，确保内核控制路径中的一些中断处理程序能访问的数据结构也受到保护。 1 禁止本地中断 然而，禁止本地中断并不保护运行在另一个CPU上的中断处理程序对该数据结构的并发访问，因此，在多处理器系统上，禁止本地中断经常与自旋锁结合使用。 宏local_irq

2010-05-31 14:32:00 4180 1

原创信号量

信号量这个东西，从本质上说，它实现了一个加锁原语，即让等待者睡眠，直到等待的资源变为空闲。实际上，Linux提供两种信号量：- 内核信号量，由内核控制路径使用- System V IPC信号量，由用户态进程使用在本专题，我们集中讨论内核信号量，而IPC信号量将有专门的专题来讲。内核信号量类似于自旋锁，因为当锁关闭着时，它不允许内核控制路径继续进行。然而，当内核控制路径试图获取内核信号量所保护的忙资源时，相应的进程被挂起，其task_struck结构被从rq上脱链。只有在资源被释放时，

2010-05-31 14:27:00 2296 3

原创 RCU机制

读-拷贝-更新（RCU）是为了保护在多数情况下被多个CPU读的数据结构而设计的另一种同步技术。RCU允许多个读者和写者并发执行（相对于只允许一个写者执行的顺序锁有了改进）。而且，RCU是不使用锁的，就是说，它不使用被所有CPU共享的锁或计数器，在这一点上与读/写自旋锁和顺序锁（由于高速缓存行窃用和失效而有很高的开销）相比RCU具有更大的优势。RCU是如何不使用共享数据结构而令人惊讶地实现多

2010-05-19 14:46:00 3994

原创顺序锁

当使用读/写自旋锁时，内核控制路径发出的执行read_lock或write_lock操作的请求具有相同的优先权：读者必须等待，直到写操作完成。同样地，写者也必须等待，直到读操作完成。Linux 2.6中引入了顺序锁（seqlock），它与读/写自旋锁非常相似，只是它为写者赋予了较高的优先级：事实上，即使在读者正在读的时候也允许写者继续运行。这种策略的好处是写者永远不会等待读（除非另外一个写

2010-05-19 14:14:00 2894 2

原创读写自旋锁

读/写自旋锁同样是在保护SMP体系下的共享数据结构而引入的，它的引入是为了增加内核的并发能力。只要内核控制路径没有对数据结构进行修改，读/写自旋锁就允许多个内核控制路径同时读同一数据结构。如果一个内核控制路径想对这个结构进行写操作，那么它必须首先获取读/写锁的写锁，写锁授权独占访问这个资源。这样设计的目的，即允许对数据结构并发读可以提高系统性能。下图显示有两个受读/写锁保护的临界区（CI和

2010-05-18 20:24:00 2093 1

原创自旋锁

加锁（locking）是一种广泛应用的同步技术。当内核控制路径必须访问共享数据结构或进入临界区时，就需要为自己获取一把“锁”。由锁机制保护的资源非常类似于限制于房间内的资源，当某人进入房间时，就把门锁上。如果内核控制路径希望访问资源，就试图获取钥匙“打开门”。当且仅当资源空闲时，它才能成功。然后，只要它还想使用这个资源，门就依然锁着。当内核控制路径释放了锁时，门就打开，另一个内核控制路径就可以进入

2010-05-18 19:59:00 3477 3

原创优化屏障和内存壁垒

当使用指令优化的编译器时，你千万不要认为指令会严格按它们在源代码中出现的顺序执行。例如，编译器可能重新安排汇编语言指令以使寄存器以最优的方式使用。此外，现代CPU通常并行地执行若干条指令，且可能重新安排内存访问。这种重新排序可以极大地加速程序的执行。然而，当处理同步时，必须避免指令重新排序。因为如果放在同步及原语之后的一条指令在同步原语本身之前执行，事情很快就会变得失控。所以，所有的同步技

2010-05-18 19:56:00 2724

原创原子操作

若干汇编语言指令都具有“读-修改-写”特点 —— 也就是说，它们访问存储器单元两次，第一次读原值，第二次写新值。假定运行在两个CPU上的两个内核控制路径试图通过执行非原子操作来同时“读-修改-写”同一存储器单元，如n++。首先，两个CPU都试图读同一单元，比如n=5。但是存储器仲裁器（对访问RAM芯片的操作进行串行化的硬件电路）插手，只允许其中的一个访问而让另一个延迟。然而，当第一个读操作

2010-05-18 19:51:00 2209

原创每CPU变量

最好的同步技术是把设计不需要同步的临界资源放在首位，这是一种思维方法，因为每一种显式的同步原语都有不容忽视的性能开销。最简单也是最重要的同步技术包括把内核变量或数据结构声明为每CPU变量（per-cpu variable）。每CPU变量主要是数据结构的数组，系统的每个CPU对应数组的一个元素。一个CPU不应该访问与其他CPU对应的数组元素，另外，它可以随意读或修改它自己的元素而不用

2010-05-18 19:47:00 5738

原创内核抢占

为了更好地理解内核代码是如何执行的，我们借用ULK-3中的思想，把内核看作必须满足两种请求的侍者：一种请求来自顾客，另一种请求来自数量有限的几个不同的老板。对不同的请求，侍者采用如下的策略：1. 老板提出请求时，如果侍者正空闲，则侍者开始为老板服务，这是空闲情况。2. 如果老板提出请求时侍者正在为顾客服务，那么侍者停止为顾客服务，开始为老板服务，这是高优先级抢占低优先级情况。

2010-05-18 18:52:00 2627

转载 rpm安装出现问题，提示lock

故障现象：[root@localhost Mysql4.1.14.Rhel3]# rpm -ivh MySQL*warning: waiting for transaction lock on /var/lib/rpm/__db.000解决方法：因为prm数据库出现损坏导致，可能导致多数rpm软件的升级、安装或者删除都会有问题。此错误，请以root身份输入

2010-05-13 16:43:00 4736 1

原创 linux下网卡网络流量监控工具

个人比较喜欢iftop，它能动态的用简单的ASC图标识网卡当前流量首行是网络流量刻度，中间是与其它机器的流量，有个白底的bar直观的标识流量变化，后三列数据分别表示：1. preceding 2 seconds 过去两秒钟的流量（traffic）2. around half that amount over the preceding 10s 过去十秒钟流量的一半

2010-05-12 12:00:00 3052

原创制作rpm包

菜菜最近做了一个Hello，World的RPM包，由于什么都不懂，所以做了一整天，有点感想，在这里把我的制作方案和经验和大家分享一下。RPM是Redhat Package Manage的缩写，将Source Code简单地包装成档案，在最终生成的RPM包中有两个档案文件，一个是ix86.rpm，另外一个是src.rpm，ix86文件包含软件发布者选择发布的应用必须的文件，而src文件则包含

2010-05-12 09:23:00 2981 1

NFS文件系统

NFS文件系统是目前最为成功的网络文件系统，在文件共享领域有着出色的表现，特别是pNFS的出现，使得NFS文件系统在性能和规模上有了大幅提升，为其带了更为广阔的应用空间。同时，NFS之所以备受关注，还在于它在NAS存储领域的关键作用。本文剖析了NFSv3文件系统源代码，使开发工程师，技术支持人员，特别是存储领域从业人员对NFS有更为深刻的认识。

2012-04-08

[数据结构(C语言版)].严蔚敏_吴伟民扫描版

《数据结构》（C语言版）是为“数据结构”课程编写的教材，也可作为学习数据结构及其算法的C程序设计的参数教材。本书的前半部分从抽象数据类型的角度讨论各种基本类型的数据结构及其应用；后半部分主要讨论查找和排序的各种实现方法及其综合分析比较。其内容和章节编排 1992年4月出版的《数据结构》（第二版）基本一致，但在本书中更突出了抽象数据类型的概念。全书采用类C语言作为数据结构和算法的描述语言。本书概念表述严谨，逻辑推理严密，语言精炼，用词达意，并有配套出版的《数据结构题集》（C语言版），便于教学，又便于自学。本书后附有光盘。光盘内容可在DOS环境下运行的以类C语言描述的“数据结构算法动态模拟辅助教学软件，以及在Windows环境下运行的以类PASCAL或类C两种语言描述的“数据结构算法动态模拟辅助教学软件”。本书可作为计算机类专业或信息类相关专业的本科或专科教材，也可供从事计算机工程与应用工作的科技工作者参考。作者简介严蔚敏，清华大学计算机系教授，长期从事数据结构教学和教材建设，和吴伟民合作编著的《数据结构》曾获“第二届普通高等学校优秀教材全国特等奖”和“1996年度国家科学技术进步奖三等奖”。

2012-01-12

数据结构与算法——面向对象C++设计模式

数据结构与算法的经典教材，系统全面地介绍了各种传统的数据结构，把它们按照类层次的现代理念予以展开，进而达到抽象结构与实际设计的完美统一。本书后三章通过引入抽象问题求解的概念，集中进述了算法技术和各算法之间的关系。另外，作者运用一定的数学工具及必要的分析技术和分析理论，对每种数据结构及相关算法都进行了时间和空间效率分析。本书作者在每章后面布置了习题和设计项目，并在全书的后面给出了问题参考答案，希望读者能在其中汲取宝贵的知识与经验。

2011-11-27

高性能分布式监控系统Ganglia详解

Ganglia是一个高性能分布式监控系统，用来监控集群和超级计算机。Ganglia是一个基于多点传送的监听/告知协议来监控集群的状态，它使用一个点对点树来访问集群并且可以统计其综合的信息。Ganglia可以广泛地使用像XML这样的技术来表示数据；使用XDR技术来聚合、轻化数据传送；使用RRDTool来存储和显示数据。

2011-07-10

几个比较著名的哈希算法

几个比较著名的哈希算法，还有哈希算法的概念以及如何优化哈希值的分布，在日常软件开发中十分有用

2011-07-07

疯狂内核之——内核初始化

目录 1 引子 2 1.1 上电 2 1.2 BIOS时代 3 1.3 内核引导程序 5 2 内核映像的形成 8 2.1 MakeFile预备知识 9 2.1.1 Makefile书写规则 9 2.1.2 Makefile变量 10 2.1.3 条件判断 14 2.1.4 函数 17 2.1.5 隐含规则 17 2.1.6 定义模式规则 19 2.1 KBuild体系 23 2.1.1 内核目标 24 2.1.2 主机程序 26 2.1.3 编译标志 27 2.2 内核编译分析 28 2.2.1 编译配置 29 2.2.2 寻找第一个目标 32 2.2.3 prepare和scripts目标 38 2.2.4 递归编译各对象 41 2.2.5 链接vmlinux 44 2.2.6 制作bzImage 50 3 实模式下的内核代码 57 3.1 内核映像内存布局 58 3.2 实模式汇编代码header.S 60 3.2.1 无用的bootsect代码 60 3.2.2 初始化头变量hdr 63 3.2.3 准备实模式下C语言环境 64 3.3 实模式代码main函数 69 3.3.1 复制初始化头变量 71 3.3.2 初始化堆 74 3.3.3 确保支持当前运行的CPU 75 3.3.4 设置BIOS的x86模式 76 3.3.5 内存的检测 78 3.3.6 设置键盘属性 81 3.3.7 填充系统环境配置表 82 3.3.8 填充IST信息 83 3.3.9 设置Video模式 83 3.4 实模式代码go_to_proteced_mode函数 91 3.4.1 禁止可屏蔽和不可屏蔽中断 92 3.4.2 打开A20地址线 93 3.4.3 安装临时全局描述符表 99 3.4.4 第一次启动保护模式 101 4 保护模式下的内核代码 107 4.1 32位x86保护模式代码 107 4.1.1 内核解压缩的前期工作 108 4.1.2 解压缩内核 111 4.1.3 第二次启动保护模式 121 4.1.4 第一次启动分页管理 124 4.1.5 初始化0号进程 128 4.2 向start_kernel进发 131 4.2.1 初始化中断描述符表 132 4.2.2 第三次启动保护模式 137 4.2.3 启动x86虚拟机 141 5 走向现代：start_kernel函数 144 5.1 初始化同步与互斥环境 148 5.1.1 屏蔽中断 148 5.1.2 启动大内核锁 152 5.1.3 注册时钟通知链 153 5.1.4 激活第一个CPU 155 5.1.5 初始化地址散列表 160 5.1.6 打印版本信息 161 5.2 执行setup_arch()函数 166 5.2.1 拷贝可用内存区信息 171 5.2.2 获得总页面数 175 5.2.3 着手建立永久内核页表 177 5.2.4 第二次启动分页管理 181 5.2.5 建立内存管理架构 186 5.2.6 添砖加瓦 192 5.3 设置每CPU环境 206 5.4 初始化内存管理区列表 211 5.5 利用early_res分配内存 214 5.6 触碰虚拟文件系统 223 5.7 初始化异常服务 224 5.8 初始化内存管理 230 5.8.1 启用伙伴算法 230 5.8.2 初始化slab分配器 241 5.8.3 初始化非连续内存区 250 5.9 初始化调度程序 251 5.10 初始化中断处理系统 256 5.10.1 设置APIC中断服务 256 5.10.2 初始化本地软时钟 264 5.10.3 软中断初始化 268 5.10.4 初始化定时器中断 271 5.11 走进start_kernel尾声 273 5.11.1 初始化slab的后续工作 273 5.11.2 启动console 275 5.11.3 一些简单的函数 276 5.11.4 校准CPU时钟速度 279 5.11.5 创建一些slab缓存 282 5.12 安装根文件系统 287 5.12.1 创建VFS相关slab缓存 288 5.12.2 安装rootfs 291 5.12.3 安装proc文件系统 296 6 后start_kernel时代 298 6.1 创建1号进程 298 6.2 子系统的初始化 306 6.3 启动shell环境 309

2011-05-30

疯狂内核之——Linux虚拟内存

目录第一章 Linux底层分段分页机制 5 1.1 基于x86的Linux分段机制 5 1.2 基于x86的Linux分页机制 7 1.2.1 页全局目录和页表 8 1.2.2 线性地址到物理地址 10 1.2.3 线性地址字段处理 13 1.2.4 页表处理 15 1.3 扩展分页与联想存储器 20 1.4 Linux内存布局 21 1.5 内核空间和用户空间 23 1.5.1 初始化临时内核页表 24 1.5.2 永久内核页表的初始化 32 1.5.3 第一次进入用户空间 41 1.5.4 内核映射机制实例 44 1.6 固定映射的线性地址 48 1.7 高端内存内核映射 50 1.8.1 永久内存映射 50 1.8.2 临时内核映射 55 第二章内核级内存管理系统 58 2.1 Linux页面管理 58 2.1.1 NUMA架构 61 2.1.2 内存管理区 62 2.2 伙伴系统算法 65 2.2.1 数据结构 66 2.2.2 块分配 67 2.2.3 块释放 69 2.3 Linux页面级内存管理 72 2.3.1 分配一组页面 73 2.3.2 释放一组页面 80 2.4 每CPU页面高速缓存 81 2.4.1 数据结构 81 2.4.2 通过每CPU 页高速缓存分配页面 82 2.4.3 释放页面到每CPU 页面高速缓存 83 2.5 slab分配器 85 2.5.1 数据结构 86 2.5.2 分配/释放slab页面 92 2.5.3 增加slab数据结构 93 2.5.4 高速缓存内存布局 94 2.5.5 slab着色 95 2.5.6 分配slab对象 96 2.5.7 释放Slab对象 100 2.5.8 通用对象 102 2.5.9 内存池 103 2.6 非连续内存区 104 2.6.1 高端内存区回顾 105 2.6.2 非连续内存区的描述符 106 2.6.3 分配非连续内存区 109 2.6.4 释放非连续内存区 113 第三章进程的地址空间 117 3.1 用户态内存分配 117 3.1.1 mm_struct数据结构 118 3.1.2 内核线程的内存描述符 122 3.2 线性区的数据结构 123 3.2.1 线性区数据结构 123 3.2.2 红-黑树算法 126 3.2.3 线性区访问权限 128 3.3 线性区的底层处理 130 3.3.1 查找给定地址的最邻近区 131 3.3.2 查找一个与给定的地址区间相重叠的线性区 135 3.3.3 查找一个空闲的地址区间 135 3.3.4 向内存描述符链表中插入一个线性区 137 3.4 分配线性地址区间 141 3.5 释放线性地址区间 151 3.5.1 do_munmap()函数 151 3.5.2 split_vma()函数 153 3.5.3 unmap_region()函数 155 3.6 创建和删除进程的地址空间 156 3.6.1 创建进程的地址空间 156 3.6.2 删除进程的地址空间 175 3.6.3 内核线程1号的地址空间 176 3.7 堆的管理 178 第四章磁盘文件内存映射 182 4.1 内存映射的数据结构 182 4.2 内存映射的创建 184 4.3 内存映射的请求调页 194 4.4 刷新内存映射的脏页 203 4.5 非线性内存映射 210 第五章页面的回收 215 5.1 页框回收概念 215 5.1.1 选择目标页 216 5.1.2 PFRA设计 217 5.2 反向映射技术 218 5.2.1 匿名页的反向映射 220 5.2.2 优先搜索树 226 5.2.3 映射页的反向映射 231 5.3 PFRA实现 235 5.3.1 最近最少使用（LRU）链表 236 5.3.2 内存紧缺回收 242 5.3.3 回收磁盘高速缓存的页 267 5.3.4 周期回收 273 5.3.5 内存不足删除程序 283 第六章交换机制 289 6.1 交换区数据结构 289 6.1.1 创建交换区 290 6.1.2 交换区描述符 291 6.1.3 换出页标识符 293 6.2 激活和禁用交换区 295 6.2.1 sys_swapon()系统调用 296 6.2.2 sys_swapoff()系统调用 304 6.2.3 try_to_unuse()函数 308 6.3 分配和释放页槽 313 6.3.1 scan_swap_map()函数 313 6.3.2 get_swap_page()函数 316 6.3.3 swap_free()函数 318 6.4 页面的换入换出 320 6.4.1 交换高速缓存 320 6.4.2 换出页 323 6.4.3 换入页 329 第七章缺页异常处理程序 335 7.1 总体流程 335 7.2 vma以外的错误地址 341 7.3 vma内的错误地址 346 7.3.1 handle_mm_fault()函数 348 7.3.2 请求调页 352 7.3.3 写时复制 358 7.4 处理非连续内存区访问 364

2011-05-30

疯狂内核之——虚拟文件系统

目录 1 虚拟文件系统概述 5 1.1 通用文件模型 7 1.2 VFS所处理的系统调用 9 2 虚拟文件系统架构 11 2.1 VFS对象数据结构 11 2.1.1 超级块对象 11 2.1.2 索引节点对象 15 2.1.3 文件对象 18 2.1.4 目录项对象 22 2.2 把Linux中的VFS对象串联起来 24 2.2.1 与进程相关的文件 25 2.2.2 索引节点高速缓存 29 2.2.3 目录项高速缓存 30 2.2.4 VFS对象的具体实现 32 2.3 文件系统的注册与安装 38 2.3.1 文件系统类型注册 38 2.3.2 文件系统安装数据结构 41 2.3.3 安装普通文件系统 52 2.3.4 分配超级块对象 58 2.3.5 安装根文件系统 60 2.3.6 卸载文件系统 65 2.4 路径名的查找 66 2.4.1 查找路径名的一般流程 67 2.4.2 父路径名查找 82 2.4.3 符号链接的查找 84 2.5 VFS系统调用的实现 88 2.5.1 open()系统调用 88 2.5.2 read()和write()系统调用 96 2.5.3 close()系统调用 97 3 第二扩展文件系统 99 3.1 Ext2磁盘数据结构 101 3.1.1 磁盘超级块 102 3.1.2 组描述符和位图 105 3.1.3 磁盘索引节点表 105 3.2 VFS接口数据结构 110 3.2.1 Ext2 超级块对象 110 3.2.2 Ext2 的索引节点对象 121 3.2.3 创建Ext2文件系统 124 3.2.4 Ext2的方法总结 126 3.3 Ext2索引节点分配 129 3.3.1 创建索引节点 130 3.3.2 删除索引节点 143 3.4 Ext2数据块分配 144 3.4.1 数据块寻址 145 3.4.2 文件的洞 147 3.4.3 分配数据块 148 4 页面高速缓存 160 4.1 页高速缓存数据结构 160 4.1.1 address_space对象 161 4.1.2 基树 164 4.2 高速缓存底层处理函数 166 4.2.1 查找页 166 4.2.2 增加页 168 4.2.3 删除页 173 4.3 文件系统与高速缓存 175 4.3.1 缓冲头数据结构 175 4.3.2 分配块设备缓冲区页 178 4.3.3 释放块设备缓冲区页 184 4.4 在页高速缓存中搜索块 185 4.4.1 __find_get_block()函数 185 4.4.2 __getblk()函数 188 4.4.3 __bread()函数 190 4.5 把脏页写入磁盘 191 4.5.1 pdflush内核线程 192 4.5.2 搜索要刷新的脏页 193 4.5.3 回写陈旧的脏页 196 5 文件读写 199 5.1 系统调用VFS层的处理 200 5.2 第二扩展文件系统Ext2层的处理 201 5.2.1 Ext2的磁盘布局 202 5.2.2 Ext2的超级块对象 206 5.2.3 Ext2索引节点对象的创建 210 5.2.4 Ext2索引节点对象的读取 218 5.2.5 Ext2层读文件入口函数 225 5.3 页高速缓存层的处理 237 5.3.1 创建一个bio请求 238 5.3.2 得到文件的逻辑块号 244 5.3.3 普通文件的readpage方法 251 5.3.4 块设备文件的readpage方法 252 5.3.5 文件的预读 260 5.4 通用块层的处理 264 5.4.1 块设备的基础知识 265 5.4.2 通用块层相关数据结构 269 5.4.3 提交I/O传输请求 271 5.4.4 请求队列描述符 273 5.5 块设备I/O调度层的处理 281 5.5.1 块设备的初始化 284 5.5.2 建立块设备驱动环境 288 5.5.3 关联block_device结构 295 5.5.4 为设备建立请求队列 306 5.5.5 块设备I/O调度程序 311 5.5.6 真实的I/O调度层处理 321 5.6 块设备驱动层的处理 330 5.6.1 scsi总线驱动的初始化 330 5.6.2 scsi设备驱动体系架构 342 5.6.3 scsi块设备驱动层处理 347 5.6.4 scsi命令的执行 369 5.6.5 scsi命令的第一次转变 372 5.6.6 scsi命令的第二次转变 380 5.7 写文件 384 5.7.1 generic file_write函数 384 5.7.2 普通文件的prepare_write方法 386 5.7.3 块设备文件的prepare_write方法 387 5.7.4 将脏页写到磁盘 388 6 直接I/O与异步I/O 391 6.1 直接I/O 391 6.2 异步I/O 393 6.2.1 Linux 2.6中的异步I/O 394 6.2.2 异步I/O环境 394 6.2.3 提交异步I/O操作 395

2011-05-30

疯狂内核之——进程管理子系统

目录 1 进程的组织 5 1.1 进程相关数据结构 5 1.1.1 进程的基本信息 6 1.1.2 进程状态 10 1.1.3 TASK_RUNNING状态的进程链表 11 1.1.4 进程间关系 12 1.2 Linux的线程——轻量级进程 15 1.3 进程的创建——do_fork()函数详解 19 1.4 执行进程间切换 33 1.4.1 进程切换之前的工作 33 1.4.2 进程切换实务 —— switch_to宏 37 1.4.3 __switch_to函数 39 1.5 fork与vfock系统调用的区别 42 1.6 内核线程 46 1.7 挂起状态进程的组织 49 1.7.1 等待队列头 49 1.7.2 等待队列的操作 50 1.7.3 进程资源限制 55 1.8 系统调用execve() 56 1.8.1 拷贝用户态参数 57 1.8.2 重要的数据结构 61 1.8.3 search_binary_handler函数 66 1.8.4 目标文件的装载和投入运行 69 1.8.5 库函数 92 2 中断控制 94 2.1 中断的分类 94 2.2 中断的硬件环境 95 2.2.1 外部中断请求IRQ 95 2.2.2 中断描述符表 96 2.2.3 中断和异常的硬件处理 97 2.3 中断描述符表 99 2.3.1 中断门、陷阱门及系统门 99 2.3.2 IDT的初步初始化 100 2.4 异常处理 101 2.5 中断处理 106 2.5.1 中断向量 107 2.5.2 IRQ数据结构 108 2.5.3 do_IRQ()函数 113 2.5.4 中断服务例程 115 2.5.5 IRQ线的动态分配 116 2.6 下半部分 117 2.6.1 软中断 118 2.6.2 tasklet 121 2.6.3 工作队列 122 2.7定时器中断 124 2.7.1 时钟与定时器 124 2.7.2 定时器中断相关的数据结构 127 2.7.3 定时器中断的上半部分 129 3 进程调度 138 3.1 进程调度的概念 138 3.2 进程调度的数据结构和优先级 141 3.2.1 进程的优先级 141 3.2.2 数据结构 145 3.3 调度程序所使用的函数 151 3.3.1 scheduler_tick函数 151 3.3.2 try_to_wake_up函数 156 3.3.3 recalc_task_prio函数 160 3.4 schedule()函数 163 3.4.1 直接调用 163 3.4.2 延迟调用 164 3.4.3 进程切换之前所做的工作 168 3.4.4 完成进程切换时所执行的操作 171 3.4.5 进程切换后所执行的操作 173 3.5 多处理器运行队列的平衡 175 3.5.1 调度域 176 3.5.2 rebalance_tick()函数 178 3.5.3 load_balance()函数 180 3.5.4 move_tasks()函数 183 3.6 进程退出 187 3.6.1 进程终止 187 3.6.2 进程删除 189 4 进程的并发性体现 191 4.1 内核抢占 193 4.1.1 内核抢占概念 193 4.1.2 同步技术总揽 196 4.2 每CPU变量 197 4.3 原子操作 199 4.4 优化屏障和内存壁垒 203 4.4.1 优化屏障 204 4.4.2 内存壁垒 204 4.5 自旋锁 206 4.6 读写自旋锁 211 4.6.1 为读获取和释放一个锁 213 4.6.2 为写获取或释放一个锁 214 4.7 顺序锁 215 4.8 RCU机制 217 4.9 信号量 219 4.9.1 获取和释放信号量 221 4.9.2 读/写信号量 224 4.9.3 补充信号量 225 4.10 禁止本地中断 226 4.10.1 禁止本地中断 227 4.10.2 禁止下半部（可延迟函数） 229 4.11 一些避免竞争条件的实例 231 4.11.1 引用计数器 231 4.11.2 大内核锁 231 4.11.3 内存描述符读/写信号量 232 4.11.4 slab高速缓存链表的信号量 233 4.11.5 索引节点的信号量 233 4.12 内核同步与互斥的总结 233

2011-05-30

疯狂内核之——Linux预备知识.pdf

目录 1.1 体系架构 3 1.1.1 Linux体系结构 4 1.1.2 一般程序的执行 5 1.2用户态向内核态切换 7 1.2.1 Linux的堆栈切换 7 1.2.2 80x86分段的总结 12 1.2.3 Linux的指针 14 1.3 C语言基本功 14 1.3.1 Linux内核中的链表 15 1.3.2 Linux双循环链表综合实例 29 1.4 内核汇编语言规则 30 1.4.1 GNU的x86汇编语言 32 1.4.2 嵌入式汇编语言 33 1.5 必要的硬件知识 37 1.5.1 EU模块 38 1.5.2 SU模块 39 1.5.3 PU模块 43 1.5.4 高速缓存 45 1.6 __attribute__ 机制 46 1.6.1 函数属性 46 1.6.2 变量属性 51 1.6.3 类型属性 52 1.6.4 变量属性与类型属性举例 54 1.7 必要的编译知识 55

2011-05-30

23种GoF设计模式Java版.pdf

如果技术人员有发展的轨迹，那么他要么“看透工具的本质，把关注点转移到‘团队’的圈子里去”，要么“顺着代码铺就的道路，亦步亦趋地成为良匠大师”。仅以技术方向而言，你大概可以做到架构师、总架构师甚至首席架构师；但问题是：你现在还只是一个程序员。那要如何才能踏上通往架构师之路呢？学习设计模式是你的必经之路

2011-05-29

基于C++语言的GoF23种设计模式

懂了设计模式，你就懂了面向对象分析和设计（OOA/D）的精要。反之好像也可能成立。道可道，非常道。道不远人，设计模式亦然如此。 GoF 的 23 种模式研读、总结和探索，对想成为系统架构师的各位来说，意义重大。

2011-05-29

从8086到Pentium Ⅲ微型计算机及接口技术3

内容提要：　　本书以Intel处理器为核心的微型计算机为背景，全面、系统、深入地介绍了微型计算机的基本组成、工作原理和实际应用，注重吸取微机发展的最新技术和最新知识，并将其融于全书之中。　　全书共分10章，分别介绍微型计算机的基本知识、从8086到PentiumⅢ循序渐进地介绍了微处理器的内部结构及特点、指令系统、汇编语言程序设计、存储器、输入输出基础、中断系统、通信与接口技术、微机总线及其接口标准和微型计算机系统板等。每章后面都有大量思考题与习题。本书可作为高等院校各个专业本、专科教材，也可作为工程技术人员的参考书。　　友情提示：虽然本书并未介绍的目前最新的处理器，但书籍是永远跟不上产品的发展速度的，更何况没有掌握基础的技术是绝对谈不上学会最新技术的，因此本书是很有价值的。本资料为PDF电子版，推荐采用Adobe Reader7.0或兼容阅读器在120%的显示比例下阅读！目录前言第1章概述 1.1 微型计算机的发展概况 1.2 计算机中信息的表示 1.3 微型计算机的硬件结构和基本工作原理 1.4 微型计算机的软件系统 1.5 微型计算机系统及性能指标思考与习题第2章微处理器 2.1 8086/8088微处理器 2.2 80286微处理器 2.3 80386微处理器 2.4 CISC与RISC 2.5 80486微处理器 2.6 Pentium微处理器 2.7 Pentium Pro微处理器 2.8 MMX及MMX Pentium微处理器 2.9 Pentium II和Pentium III微处理器 2.10 新一代64位微处理器Merced 思考与习题第3章 80X86指令系统 3.1 指令格式与编码 3.2 寻址方式 3.3 8086/8088指令系统 3.4 80286增强和扩充的指令 3.5 80386增强和扩充的指令 3.6 80486和Pentium增强和扩充的指令思考与习题第4章汇编语言程序设计 4.1 概述 4.2 80X86宏汇编语言的数据和表达式 4.3 80X86宏汇编语言的伪指令语句 4.4 汇编语言程序设计方法思考与习题第5章微型计算机中的存储器 5.1 存储器概述 5.2 半导体存储器分类及性能指标 5.3 随机存取存储器 5.4 只读存储器 5.5 存储器的扩展 5.6 微机内存层次结构 5.7 微机系统中的其他存储部件 5.8 微型计算机系统的内存管理思考与习题第6章输入输出基础 6.1 概述 6.2 输入输出控制方式 6.3 I/O接口的基本结构及特点 6.4 I/O接口的读写技术 6.5 DMA控制器思考与习题第7章微型计算机的中断系统 7.1 中断的基本概念 7.2 可编程中断控制器8259A 7.3 中断调用及中断程序设计思考与习题第8章微机通信与接口技术 8.1 并行通信与串行通信 8.2 可编程串行通信接口芯片16550与8250 8.3 可编程并行通信接口芯片8255 8.4 可编程定时/计数器芯片8253与8254 8.5 A/D与D/A转换接口 8.6 打印机接口 8.7 显示适配器接口 8.8 软硬盘接口 8.9 调制解调器 8.10 简单实用的双机通信思考与习题第9章微机总线及其接口标准 9.1 总线概述 9.2 总线层次及信号类型 9.3 ISA总线 9.4 EISA总线 9.5 VESA总线 9.6 PCI总线 9.7 AGP 思考与习题第10章微型计算机系统板 10.1 系统板概述 10.2 PC/XT和286系统板 10.3 386和486系统板 10.4 Pentium和PentiumⅡ/Ⅲ系统板 10.5 系统板重要元器件及接口功能介绍 10.6 微机硬件新技术思考与习题参考文献

2010-09-24

Linux sysfs 文件系统机制详解

Linux sys文件系统机制是非常难懂的一个机制。文章主要介绍了一些设备驱动相关的sys文件系统，结合ldd3(linux device driver 3)中的示例代码(主要是lddbus 和sculld 文件夹)，详细分析虚拟文件系统sysfs，以及如何编写基于sysfs的模块化的驱动程序。使用的内核是2.6.18。

2009-12-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人