Linux内存管理--基础知识-CSDN博客

本文链接：https://blog.csdn.net/yaoming168/article/details/131256309

探讨Linux内核内存管理基础，涵盖CPU访问速度差异、内存数据结构、匿名页面生命周期、页面迁移与规整策略、KSM页面合并机制及kswapd工作原理。分析内存分配、碎片管理与外碎片处理，涉及Linux内核实战统计与优化技巧。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

内存管理

基础知识
kswapd
匿名页面
页面迁移
内存规整
KSM（Kernel SamePage Merging）
内存管理实战

基础知识

1．CPU访问各级存储结构的速度是否一样？

答：
不同级别的存储结构对于CPU的访问速度是不同的。通常来说，CPU访问速度最快的是寄存器，其次是一级缓存（L1 Cache），二级缓存（L2 Cache），三级缓存（L3 Cache），最后是主存储器（DRAM）。
寄存器是CPU内部的存储器，访问速度非常快，可以在一个CPU周期内完成访问。
一级缓存（L1 Cache）是CPU内部的缓存，访问速度也非常快，通常可以在一个CPU周期内完成访问。
二级缓存（L2 Cache）和三级缓存（L3 Cache）是位于CPU和主存储器之间的缓存，访问速度比主存储器快很多，但比L1 Cache慢一些。
主存储器（DRAM）是CPU访问速度最慢的存储结构，访问速度通常需要几十个CPU周期。因此，在程序设计中，应尽可能地利用寄存器和缓存，以减少对主存储器的访问，从而提高程序的执行效率。

2．请绘制内存管理常用的数据结构的关系图。如mm_struct、VMA、vaddr、page、PFN、PTE、zone、paddr和pg_data等，并思考如下转换关系。

答：

1）如何由mm_struct和vaddr找到对应的VMA？
2）如何由page和VMA找到vaddr？
3）如何由page找到所有映射的VMA？
4）如何由VMA和vaddr找出相应的page数据结构？
5）page和PFN之间如何互换？
6）PFN和paddr之间如何互换？
7）page和PTE之间如何互换？
8）zone和page之间如何互换？
9）zone和pg_data之间如何互换？

3．在ARM64内核中，内核映像文件映射到内核空间的什么地方？

答：
在ARM64内核中，内核映像文件通常被映射到内核空间的虚拟地址空间的起始位置。这个虚拟地址通常是一个固定的值，由具体的内核配置和ARM64体系结构的要求确定。

在启动过程中，ARM64内核会将内核映像文件加载到内存中，并将其映射到内核空间的合适位置。这个位置通常是通过链接脚本或启动代码中指定的。一旦内核映像文件被映射到内核空间，内核就可以在该地址空间中执行代码，并访问内核的数据结构和功能。

需要注意的是，具体的内核映射地址可能因不同的ARM64系统和内核配置而有所差异。因此，在具体的ARM64系统中，可以通过查看内核的启动代码或相关的文档来确定内核映像文件在内核空间中的映射位置。

4．在ARM64内核中，内核空间和用户空间是如何划分的？

答：
在ARM64内核中，内核空间和用户空间是通过虚拟地址空间的划分来实现的。

ARM64使用了一种称为"虚拟地址空间布局"（Virtual Address Space Layout）的机制来划分内核空间和用户空间。在这种布局中，整个虚拟地址空间被划分为两个部分：

内核空间（Kernel Space）：内核空间是用于运行操作系统内核的部分。它包含了内核代码、数据结构、设备驱动程序等。在ARM64中，内核空间通常位于虚拟地址空间的高地址部分。
用户空间（User Space）：用户空间是用于运行用户应用程序的部分。它包含了应用程序的代码、数据、堆栈等。在ARM64中，用户空间通常位于虚拟地址空间的低地址部分。

通过将内核空间和用户空间划分在不同的地址范围内，ARM64内核能够实现对内核和用户应用程序的隔离。这使得用户应用程序无法直接访问内核空间的代码和数据，从而提高了系统的安全性和稳定性。

需要注意的是，具体的内核空间和用户空间的划分方式可能因不同的ARM64系统和内核配置而有所差异。但通常情况下，ARM64内核会使用虚拟地址空间布局来划分内核空间和用户空间。

5．在系统启动时，ARM64 Linux内核如何知道系统有多大的物理内存？

答：
在系统启动时，ARM64 Linux内核通过使用底层硬件和固件提供的机制来获取系统的物理内存大小。

一种常见的机制是通过固件（如UEFI或BIOS）提供的信息来获取物理内存大小。ARM64系统的固件通常会提供一个称为"EFI_MEMORY_DESCRIPTOR"的数据结构，其中包含了系统中每个内存区域的信息，包括起始地址、大小和属性等。内核可以通过解析这个数据结构来获取物理内存的大小。

另一种机制是通过硬件中的内存控制器来获取物理内存的大小。ARM64系统中的内存控制器负责管理物理内存的分配和访问。内核可以与内存控制器进行通信，查询物理内存的大小和其他属性。

无论是通过固件还是硬件机制，ARM64 Linux内核在启动过程中会获取物理内存的大小，并将其记录在内核数据结构中。这些信息对于内核的内存管理和资源分配非常重要，例如用于创建页表、分配内存页面和设备映射等操作。

6．物理内存页面如何添加到伙伴系统中，是一页一页添加，还是以2n来添加呢？

答：
物理内存页面在伙伴系统中的添加是以2的幂次来进行的。伙伴系统使用了一种称为伙伴分配算法的技术，它将物理内存划分为不同大小的内存块，每个内存块的大小都是2的幂次。

当需要分配一块指定大小的内存时，伙伴系统会寻找合适的内存块大小来满足需求。如果没有与所需大小完全匹配的内存块，伙伴系统会选择一个比所需大小稍大的内存块，并将其分割成两个较小的伙伴块。这些伙伴块的大小都是原始块大小的一半。

当释放一个已分配的内存块时，伙伴系统会检查其相邻的内存块是否也是空闲的，并尝试合并它们成为一个更大的内存块。如果相邻的内存块都是空闲的，并且大小相同，则它们会被合并成一个更大的伙伴块。

因此，物理内存页面在伙伴系统中的添加是以2的幂次进行的，通过分割和合并来管理不同大小的内存块。这种方式可以提高内存的利用率和管理效率。

7．page数据结构中的_refcount和_mapcount有什么区别？

答：
在page数据结构中，_refcount和_mapcount都是用来记录页面的引用计数的。但是它们的含义略有不同：

_refcount：表示页面被映射到进程的地址空间中的次数，即页面被多少个进程共享。当一个进程映射该页面时，_refcount会加1；当一个进程不再映射该页面时，_refcount会减1。当_refcount为0时，表示该页面不再被任何进程使用，可以被释放。
_mapcount：表示页面被映射到物理内存中的次数。当一个进程映射该页面时，_mapcount会加1；当一个进程不再映射该页面时，_mapcount会减1。当_mapcount为0时，表示该页面不再被映射到物理内存中，可以被交换出去或者释放。

因此，_refcount和_mapcount都是用来判断页面是否可以被释放的，但是从不同的角度出发。_refcount主要用于进程之间的共享，而_mapcount主要用于页面的物理内存管理。

8．匿名页面和高速缓存页面有什么区别？

答：
Linux中的匿名页面和高速缓存页面与前面提到的概念类似。

匿名页面（Anonymous Page）指的是在内存中分配给进程的页面，但没有与之关联的文件。这些页面通常用于存储进程的堆栈、动态分配的内存以及其他临时数据。匿名页面是进程私有的，其他进程无法直接访问。

高速缓存页面（Cached Page）是指Linux内核通过文件系统缓存机制将磁盘上的文件数据缓存在内存中，以提高文件访问的速度。当文件被读取时，内核会首先检查缓存中是否存在该文件的副本，如果存在，则直接从缓存中读取，而不需要再次访问磁盘。

因此，匿名页面和高速缓存页面的区别在于匿名页面是进程私有的内存页面，而高速缓存页面是内核通过文件系统缓存机制缓存的文件数据。

9．page数据结构中有一个锁，我们称为页锁，请问trylock_page()和lock_page()有什么区别？

答：
在Linux的page数据结构中，页锁是用于保护页面的并发访问的一种机制。trylock_page()和lock_page()是用于获取页锁的两个函数，它们之间有以下区别：

trylock_page(): 这个函数尝试获取页面的锁，如果锁是可用的，则立即获取锁并返回0。如果锁当前不可用（已被其他进程持有），则函数立即返回一个非零值，表示获取锁失败。因此，trylock_page()是非阻塞的，不会一直等待锁的释放。
lock_page(): 这个函数用于获取页面的锁，如果锁当前不可用，则会使进程进入睡眠状态，直到锁可用为止。lock_page()是阻塞的，会一直等待直到获取到锁。

总结来说，trylock_page()是一个非阻塞的锁获取函数，如果锁不可用，会立即返回。而lock_page()是一个阻塞的锁获取函数，如果锁不可用，会使进程等待直到锁可用为止。选择使用哪个函数取决于具体的需求和应用场景。

10．请列举page数据结构中_refcount和_mapcount计数的使用案例。

答：
page数据结构中的_refcount和_mapcount计数在内核中有多种使用案例。以下是一些常见的使用案例：

页面引用计数（_refcount）：
- 内存管理：_refcount用于跟踪页面的引用次数。当页面被多个对象引用时，_refcount会相应增加；当引用被释放时，_refcount会相应减少。这帮助内核确定何时可以安全地释放页面。
- 内存回收：在内存回收过程中，_refcount用于判断页面是否仍然被引用。如果_refcount为0，表示页面没有被引用，可以被回收。
页面映射计数（_mapcount）：
- 虚拟内存管理：_mapcount用于跟踪页面的映射情况。当一个页面被映射到一个或多个虚拟地址空间时，_mapcount会相应增加；当页面不再被任何虚拟地址空间映射时，_mapcount会相应减少。这帮助内核确定何时可以安全地回收页面或执行页面交换操作。
- 页面交换：在页面交换过程中，_mapcount用于判断页面是否仍然被映射。如果_mapcount为0，表示页面没有被映射，可以进行页面交换操作。

这些计数的使用案例可以在Linux内核的各个子系统中找到，例如内存管理子系统、虚拟内存管理子系统等。具体的使用方式和逻辑会因具体的场景和需求而有所不同。

11．请简述page数据结构中mapping成员的作用。

答：
在page数据结构中，mapping成员用于指向与该页面相关的文件映射（file mapping）。文件映射是将文件的内容映射到内存中的一种机制，允许对文件进行读取和写入操作。

mapping成员的作用是将页面与文件映射关联起来，以便在读取或写入页面时，能够直接与文件进行交互。通过mapping成员，内核可以知道哪个文件与该页面相关联，以及文件在磁盘上的位置。

具体而言，mapping成员包含了文件映射相关的信息，例如文件的inode（索引节点）指针、文件的偏移量等。这些信息可以帮助内核定位文件的内容以及与页面的关联关系。

通过mapping成员，内核可以实现诸如页面的读取、写入、同步等操作，以及文件和页面之间的关联管理。这对于文件系统、虚拟内存管理和文件I/O等子系统非常重要，使得内核能够有效地管理和操作文件与内存之间的数据交互。

12．在Linux 2.4.x内核中，如何从一个页面中找到所有映射该页面的VMA？RMAP可以带来哪些便利？

答：
在Linux 2.4.x内核中，要从一个页面中找到所有映射该页面的VMA（Virtual Memory Area），可以通过以下步骤：

获取页面所在的页框号（Page Frame Number，PFN）。
遍历进程的VMA链表，找到每个VMA。
对于每个VMA，检查它所映射的页框号是否与步骤1中的PFN相匹配，如果匹配，则表示该VMA映射了该页面。

在Linux 2.4.x内核中，RMAP（Reverse Mapping）机制可以在内核中实现上述步骤。RMAP是一种以页面为中心的映射关系跟踪机制，可以通过页面找到所有映射该页面的VMA。

RMAP带来以下便利：

高效查找页面的映射：通过RMAP，内核可以快速找到映射了某个页面的所有VMA，而无需遍历整个进程的VMA链表。
页面回收和交换：RMAP可以帮助内核在进行页面回收或页面交换时，确定哪些VMA映射了该页面。这样，内核可以安全地回收或交换页面，而不会影响仍然在使用该页面的VMA。
内存管理：RMAP可以用于内存管理操作，例如页面迁移、页面合并等。通过追踪页面的映射关系，内核可以更有效地管理和操作内存。

总而言之，RMAP机制在Linux 2.4.x内核中提供了一种高效的页面映射关系跟踪方式，可以带来便利的页面管理和操作。需要注意的是，RMAP机制在后续的Linux内核版本中可能有所改变或优化。

13．在Linux 2.6.34内核中，RMAP机制采用了新的实现，Linux 2.6.33内核和之前的版本中的RMAP机制称为旧版本RMAP机制。那么在旧版本RMAP机制中，如果父进程有1000个子进程，每个子进程都有一个VMA，每个VMA里面有1000个匿名页面，当所有的子进程的VMA同时发生写时复制时会是什么情况呢？

答：
在旧版本的RMAP机制中，当父进程有1000个子进程，每个子进程都有一个VMA，每个VMA中包含1000个匿名页面，并且所有子进程的VMA同时发生写时复制（Copy-on-Write）时，会发生以下情况：

写时复制：写时复制是一种延迟复制的机制，当多个进程共享同一个页面时，只有当其中一个进程尝试写入页面时，才会进行实际的复制操作。这样可以避免不必要的复制开销。
页面复制：当一个子进程尝试写入其VMA中的某个页面时，旧版本的RMAP机制会触发写时复制操作。这将导致该页面从父进程的VMA中复制到子进程的VMA中，以确保每个进程都有自己的页面副本。
页面映射更新：在写时复制期间，旧版本的RMAP机制会更新相关的页表项，将子进程的VMA映射到新复制的页面。这样，子进程就可以在其私有的VMA中进行写入操作，而不会影响其他进程的页面。

总结起来，当所有子进程的VMA同时发生写时复制时，旧版本的RMAP机制会将父进程的页面复制到子进程的VMA中，以确保每个进程都有自己的页面副本。这样，每个进程可以独立地进行写入操作，而不会影响其他进程的页面。这种机制保证了进程间的数据隔离性和独立性。

kswapd

1．kswapd内核线程何时会被唤醒？

答：
kswapd内核线程是Linux内核中负责处理内存交换（swap）和页面回收的线程。kswapd线程会在以下情况下被唤醒：

内存不足：当系统内存不足时，kswapd线程会被唤醒来执行内存回收操作，以释放未使用的页面并回收内存空间。
内存压力：当系统内存压力增加时，例如内存使用率过高或页面交换频繁，kswapd线程会被唤醒来处理内存压力情况，以尽可能减少内存压力。
页面回收：当系统需要回收页面时，例如当某个进程释放了大量页面或页面被标记为可回收时，kswapd线程会被唤醒来执行页面回收操作，以回收未使用的页面并提供更多的可用内存。

需要注意的是，具体的唤醒时机和行为可能会因Linux内核版本和配置而有所不同。kswapd线程的唤醒是由内核根据内存管理策略和系统需求来决定的，以维护系统的内存稳定性和性能。

2．LRU链表如何知道页面的活动频繁程度？

答：
LRU（Least Recently Used）链表是一种常用的页面置换算法，用于管理内存中的页面。LRU链表通过维护页面的访问顺序，可以了解页面的活动频繁程度。

在LRU链表中，最近被访问的页面位于链表的前面，而最久未被访问的页面位于链表的末尾。当一个页面被访问时，它会被移动到链表的前面，表示它是最近使用过的页面。这样，链表的头部始终是最近被访问的页面，而链表的尾部是最久未被访问的页面。

LRU链表通过这种方式反映了页面的活动频繁程度。当需要进行页面置换时，可以选择链表尾部的页面进行置换，因为它们是最久未被访问的页面，被认为是最不活跃的页面。相反，链表头部的页面是最近被访问的，被认为是最活跃的页面，通常会保留在内存中。

通过观察LRU链表的顺序，可以大致判断页面的活动频繁程度。靠近链表头部的页面很可能是频繁访问的热点页面，而靠近链表尾部的页面很可能是不经常访问的冷门页面。

需要注意的是，LRU链表只提供了对页面活动频繁程度的一种估计，而不是精确的度量。实际上，LRU链表的维护和使用是一种近似算法，它无法完全准确地反映页面的访问模式，但在大多数情况下，它是一种有效的页面置换策略。

3．kswapd按照什么原则来换出页面？

答：
kswapd是Linux内核中负责处理内存交换和页面回收的线程。kswapd按照以下原则来选择和换出页面：

LRU（Least Recently Used）原则：kswapd首先会查找LRU链表中最久未被访问的页面，即链表尾部的页面。这些页面往往是最不活跃的页面，被认为是较好的置换候选。
页面脏（Dirty）状态：kswapd会优先选择脏页面进行置换。脏页面是指已被修改但尚未写回磁盘的页面。通过将脏页面写回磁盘，可以释放内存并确保数据的持久性。
匿名（Anonymous）页面：kswapd也会优先选择匿名页面进行置换。匿名页面是指没有对应文件映射的页面，通常是由进程的堆栈、堆分配或共享内存等分配的页面。这些页面相对于文件映射的页面更容易进行置换。
页面使用计数（Page Usage Count）：kswapd会考虑页面的使用计数。如果一个页面的使用计数较高，表示它可能仍然被活跃使用，kswapd会尽量避免将其置换出去。
页面回收策略：kswapd还会根据内存回收策略来选择页面进行置换。不同的策略可能会根据系统的内存压力、页面状态等因素进行调整。

需要注意的是，页面置换是一种复杂的内存管理问题，具体的实现和算法可能会因Linux内核版本和配置而有所不同。kswapd会根据系统需求和内存管理策略来选择合适的页面进行置换，以维护系统的内存稳定性和性能。

4．kswapd按照什么方向来扫描zone？

答：
kswapd在扫描内存区域（zone）时按照以下方向进行扫描：

从高优先级zone到低优先级zone：kswapd会按照内存区域的优先级顺序进行扫描。不同的内存区域有不同的优先级，通常高优先级的区域包含了更重要的内存页，例如内核代码和数据。kswapd会首先扫描高优先级的区域，以确保这些重要的区域的内存需求得到满足。
从活动区域（active zone）到非活动区域（inactive zone）：kswapd会先扫描活动区域，这些区域包含了活跃访问的页面。通过释放或置换活动区域中的页面，可以提供更多的内存供活跃进程使用。然后，kswapd会扫描非活动区域，这些区域包含了较少被访问的页面。
扫描per-node区域：在NUMA（Non-Uniform Memory Access）系统中，kswapd会按照per-node区域的顺序进行扫描。每个NUMA节点都有自己的内存区域，kswapd会按照节点顺序扫描，以平衡内存的使用和页面的分配。

通过按照这样的方向扫描内存区域，kswapd可以更有效地管理内存，并根据内存需求和优先级来进行页面置换和回收。需要注意的是，具体的扫描方向和策略可能会因Linux内核版本和配置而有所不同。

5．kswapd以什么标准来退出扫描LRU链表？

答：
kswapd退出扫描LRU链表的标准是根据内存回收的目标和条件来确定。具体来说，kswapd在扫描LRU链表时会考虑以下标准：

扫描次数限制：kswapd会设置一个扫描次数的限制，以避免在一次扫描中耗费过多的时间。一旦达到扫描次数的限制，kswapd将会退出扫描LRU链表。
内存回收目标：kswapd的主要目标是回收未使用的页面并释放内存空间。一旦达到内存回收的目标，即成功回收了足够的页面或释放了足够的内存空间，kswapd将会退出扫描LRU链表。
内存回收策略：kswapd可能会根据内存回收策略来确定何时退出扫描LRU链表。不同的策略可能会根据系统的内存压力、页面状态等因素进行调整。

需要注意的是，kswapd的退出扫描LRU链表的标准是根据内核的具体实现和配置而有所不同。在不同版本的Linux内核中，可能会有不同的标准和条件来控制kswapd的行为。

6．移动设备操作系统（如Android操作系统），没有交换分区或者交换文件，kswapd会扫描匿名页面LRU吗？

答：
在移动设备操作系统（例如Android操作系统）中，如果没有启用交换分区或交换文件，kswapd不会扫描匿名页面的LRU链表。因为在没有交换空间的情况下，没有可以将页面置换到的地方。

在没有交换空间的情况下，内存管理的重点是通过其他手段来管理内存，例如页面回收和压缩等。kswapd的主要任务是处理页面回收和内存压缩，以释放未使用的页面并提供更多的可用内存，而不是扫描LRU链表。

需要注意的是，具体的内存管理策略和行为可能因移动设备操作系统的实现而有所不同。不同的操作系统可能会采用不同的方法来管理内存和处理页面回收，以适应移动设备的特定需求和限制。

7．swappiness的含义是什么？kswapd如何计算匿名页面和页面高速缓存之间的扫描比重？

答：
swappiness是一个用于调整内核在内存紧缺时对页面置换的偏好程度的参数。它的取值范围是0到100，其中0表示尽量避免页面置换，而100表示更积极地进行页面置换。

具体而言，swappiness参数决定了内核在内存紧缺时选择页面置换的倾向。较低的swappiness值意味着内核更倾向于将新的页面放入内存而不进行置换，以避免较高的页面置换开销。较高的swappiness值则表示内核更倾向于进行页面置换，以释放内存并提供更多可用内存。

关于kswapd如何计算匿名页面和页面高速缓存之间的扫描比重，具体的计算方式可能因不同的内核版本和配置而有所不同。一般来说，kswapd会根据内核的内存管理策略和配置来决定扫描匿名页面和页面高速缓存的比重。

在一些内核版本中，kswapd可能会根据匿名页面和页面高速缓存的使用情况来动态调整扫描比重。例如，如果匿名页面的使用较多，kswapd可能会更频繁地扫描匿名页面以释放内存。而如果页面高速缓存的使用较多，kswapd可能会更频繁地扫描页面高速缓存以释放内存。

需要注意的是，具体的计算和调整策略可能因不同的内核版本和配置而有所不同。这些策略旨在根据系统的内存使用情况和需求来进行动态调整，以实现更有效的内存管理和页面置换。

8．当系统中充斥着大量只访问一次的文件访问时，kswapd如何来规避这种访问？

答：
当系统中存在大量只访问一次的文件访问时，kswapd（内核中的页面交换和回收线程）无法直接规避这种访问。kswapd的主要任务是处理内存交换和页面回收，而对于只访问一次的文件访问，它不会主动干预。

对于只访问一次的文件访问，内核通常会采用其他机制来处理，以提高性能和效率。例如，内核可能会使用文件系统缓存（page cache）来缓存最近访问的文件数据，以减少对磁盘的频繁访问。

文件系统缓存是一种内核维护的页面高速缓存，用于存储最近访问的文件数据。当应用程序访问文件时，内核会首先检查文件系统缓存，如果文件数据已经在缓存中，则可以直接从缓存中读取，而无需进行磁盘访问。这可以提高文件访问的速度和效率。

通过使用文件系统缓存，内核可以减少对只访问一次的文件的磁盘访问次数。然而，如果系统中存在大量只访问一次的文件，并且内存资源有限，可能会导致缓存命中率下降，从而影响性能。在这种情况下，增加内存大小或调整内核参数（如文件系统缓存大小限制）可能有助于改善性能。

需要注意的是，具体的处理方式和优化策略可能因不同的内核版本和配置而有所不同。内核会根据系统的内存使用情况和访问模式来进行动态调整和优化，以提供更好的性能和效率。

9．在回收页面高速缓存时，对于脏的页面高速缓存，kswapd会马上回写吗？

答：
在回收页面高速缓存时，对于脏的页面高速缓存，kswapd不会立即回写。相反，kswapd会将脏的页面高速缓存标记为“脏”状态，并将其添加到脏页面链表中。这些脏页面会在稍后的时间由后台的写回进程（如pdflush或bdflush）异步地进行回写操作。

延迟回写脏页面的主要原因是为了提高性能。如果每次遇到脏页面都立即进行回写，会导致频繁的磁盘访问，降低系统的响应速度。相反，通过将脏页面添加到脏页面链表中，并延迟回写操作，可以将多个脏页面的回写操作合并为一次较大的回写操作，从而提高磁盘访问的效率。

后台的写回进程会定期扫描脏页面链表，并将脏页面写回到磁盘。这个过程是异步的，因此kswapd可以继续处理其他的内存管理任务，而不需要等待回写操作完成。

需要注意的是，具体的回写策略和时间间隔可能会因不同的内核版本和配置而有所不同。内核会根据系统的内存使用情况和性能需求来动态调整回写策略，以提供最佳的性能和效率。

10．内核中有哪些页面会被kswapd回写到交换分区？

答：
kswapd是Linux内核中负责处理内存交换和页面回收的线程。它会将一些页面回写到交换分区，以释放内存并为其他需要内存的进程提供空间。以下是一些常见的情况，会导致kswapd将页面回写到交换分区：

脏页面：脏页面是指已被修改但尚未写回磁盘的页面。当系统内存不足时，kswapd会优先选择脏页面进行回写，以释放内存。这样可以确保数据的持久性，并为其他进程提供更多的可用内存。
匿名页面：匿名页面是指没有对应文件映射的页面，通常是由进程的堆栈、堆分配或共享内存等分配的页面。当系统内存不足时，kswapd也会考虑回写匿名页面到交换分区，以释放内存。

需要注意的是，回写到交换分区是一种延迟操作。kswapd会将脏页面标记为“脏”状态，并将其添加到脏页面链表中。然后，后台的写回进程（如pdflush或bdflush）会定期扫描脏页面链表，并将脏页面写回到交换分区。这个过程是异步的，以提高磁盘访问的效率。

具体的回写策略和时间间隔可能会因不同的内核版本和配置而有所不同。内核会根据系统的内存使用情况和性能需求来动态调整回写策略，以提供最佳的性能和效率。

匿名页面

1．请简述匿名页面的生命周期。

答：
匿名页面是指没有对应文件映射的页面，通常是由进程的堆栈、堆分配或共享内存等分配的页面。匿名页面的生命周期可以概括为以下几个阶段：

分配阶段：在进程需要分配内存时，通常会使用匿名页面来满足需求。这些页面通过内核的内存管理机制进行分配，并与进程的虚拟地址空间建立映射关系。
使用阶段：在进程执行过程中，匿名页面被用于存储进程的数据、堆栈或共享内存等。进程可以读取和写入这些页面，进行数据的处理和交互。
页面回收阶段：当系统内存不足时，匿名页面可能会被回收以释放内存空间。这通常由内核的内存回收机制（如kswapd线程）负责。回收时，内核会检查页面的使用情况和访问频率，决定是否回收页面。
交换到磁盘阶段：如果匿名页面被回收并且被标记为脏（已被修改但尚未写回磁盘），内核可能会将这些脏页面写回到交换分区。这样可以释放内存并确保数据的持久性。
释放阶段：当匿名页面不再被进程使用时，或者进程终止时，这些页面会被释放回系统的内存池，以便重新分配给其他进程使用。

需要注意的是，匿名页面的生命周期可能会受到内核的内存管理策略、进程的行为以及系统的内存压力等因素的影响。具体的生命周期和行为可能会因不同的操作系统和配置而有所不同。

2．在什么情况下会产生匿名页面？

答：
匿名页面通常在以下情况下产生：

进程堆分配：当进程通过动态内存分配函数（如malloc）请求内存时，操作系统会分配匿名页面来满足进程的堆分配需求。
进程堆栈：每个进程都有一个堆栈用于存储函数调用和局部变量等信息。当进程创建时，操作系统会为其分配匿名页面来作为堆栈空间。
共享内存：进程间通信机制中的共享内存允许多个进程共享同一块内存区域。这些共享内存区域通常使用匿名页面来实现。
临时数据：进程在执行过程中可能需要临时存储一些数据，这些数据可能不需要持久保存到文件中。为了满足这种需求，操作系统会分配匿名页面作为临时数据的存储空间。

需要注意的是，匿名页面与文件映射页面（例如通过mmap映射的文件）不同。匿名页面没有对应的文件，而是由操作系统分配的内存区域。匿名页面通常用于进程的堆、栈和临时数据等，而文件映射页面用于将文件内容映射到进程的虚拟地址空间中。

匿名页面的产生与进程的动态内存需求和数据存储需求密切相关，它们在进程的生命周期中动态分配和释放。

3．在什么条件下会释放匿名页面？

答：
匿名页面的释放通常发生在以下情况下：

进程终止：当一个进程终止时，操作系统会回收该进程所使用的所有资源，包括匿名页面。这些页面会被释放，并返回给系统的可用内存池。
内存压力：当系统内存不足时，操作系统可能会选择回收一些进程的匿名页面来释放内存。这是通过页面置换算法（如LRU）来实现的，操作系统会选择最不活跃的匿名页面进行置换和释放。
内存回收策略：操作系统可以根据内存管理策略和配置来决定何时释放匿名页面。这可能涉及到内存压力、页面的使用情况、进程的优先级等因素。
动态内存释放：如果进程通过动态内存分配函数（如malloc）分配了匿名页面，并在不再需要时显式地释放它们，那么这些页面会在释放时返回给系统的可用内存池。

需要注意的是，匿名页面的释放是由操作系统的内存管理机制来控制的，具体的释放时机和策略可能会因操作系统和配置而有所不同。释放匿名页面是为了回收内存资源并提供给其他进程使用，以满足系统的内存需求。

页面迁移

1．页面迁移是基于什么原理来实现的？

答：
页面迁移是一种内存管理技术，用于将页面从一个物理内存位置移动到另一个物理内存位置。页面迁移的实现基于以下原理：

页面状态：在进行页面迁移之前，需要确定页面的状态。常见的页面状态包括脏（Dirty）页面和干净（Clean）页面。脏页面是已被修改但尚未写回磁盘的页面，而干净页面是未被修改或已被写回磁盘的页面。
内存压力：页面迁移通常是为了缓解内存压力。当系统内存不足时，通过迁移页面可以释放一些内存空间，以满足其他进程或操作系统的需求。
迁移策略：页面迁移可以根据不同的策略进行，例如最小化迁移（Minimize Migration）策略、最小化干扰（Minimize Disturbance）策略等。不同的策略会考虑页面的访问频率、页面的重要性、迁移的开销等因素，以选择合适的页面进行迁移。
迁移算法：页面迁移的实现需要使用适当的算法来决定迁移的目标位置和具体的迁移操作。常见的迁移算法包括基于LRU（Least Recently Used）的算法、基于页面访问频率的算法等。

通过以上原理，操作系统可以根据内存压力和迁移策略来选择合适的页面进行迁移，以释放内存并提供更好的内存管理和性能。页面迁移是一种动态的内存管理技术，可以帮助操作系统更有效地利用可用的物理内存资源。

2．内核中有哪些页面可以迁移？

答：
在操作系统内核中，可以进行页面迁移的主要类型包括：

匿名页面（Anonymous Pages）：这些页面是由进程动态分配的，通常用于堆分配、栈分配和共享内存等。由于它们没有与文件映射关联，因此可以相对容易地进行迁移。
文件映射页面（File Mapped Pages）：这些页面是通过文件映射到进程的虚拟地址空间的，例如通过mmap系统调用。这些页面通常与文件的内容相关联。页面迁移可能需要将文件的内容写回磁盘，并在迁移完成后重新映射到新的物理内存位置。
共享页面（Shared Pages）：这些页面在多个进程之间共享，例如通过fork或共享库的使用。在进行页面迁移时，需要确保所有共享该页面的进程都能够访问到迁移后的页面。

需要注意的是，页面迁移是一种复杂的操作，可能涉及到多个进程和数据的一致性。在进行页面迁移时，操作系统需要考虑页面的状态、页面的访问频率、进程间的共享关系等因素，以确保迁移的正确性和性能。具体的页面迁移实现可能会因操作系统和内核版本而有所不同。

3．内核本身使用的页面是否可以迁移？为什么？

答：
内核本身使用的页面通常是不可迁移的。这是因为内核代码和数据在系统运行期间是必须一直驻留在内存中的，以确保操作系统的正常运行。

内核代码和数据的驻留在内存中有以下原因：

系统启动和初始化：内核在系统启动时会加载到内存中，并进行初始化。这些初始化过程中使用的页面包含了操作系统的核心代码和数据结构，必须一直驻留在内存中，以确保系统的正常运行。
中断和异常处理：内核需要能够及时响应中断和异常事件，以处理硬件设备的请求和系统异常情况。为了能够快速响应这些事件，相关的中断处理程序和异常处理程序必须始终在内存中可用。
内核空间的特权：内核运行在特权模式下，拥有对系统硬件和资源的直接访问权限。为了确保安全性和稳定性，内核的代码和数据必须保持在内存中，以防止被意外或恶意修改。

由于这些原因，内核本身使用的页面通常被认为是固定的，不会进行迁移。页面迁移主要适用于用户空间的进程和文件映射页面，用于优化内存使用和调整页面的位置。而内核空间的页面则被视为系统的核心组成部分，需要始终保持在内存中以确保系统的正常运行。

4．在页面迁移的过程中需要注意些什么？

答：
在页面迁移的过程中，需要注意以下几个方面：

页表更新：在进行页面迁移时，需要更新相关的页表项，将原先指向旧位置的页表项更新为指向新位置的页表项。确保页面迁移后，进程能够正确地访问到新位置的页面。
页面同步：在进行页面迁移时，需要确保页面的数据在迁移过程中的一致性。通常会使用锁或其他同步机制来避免多个线程同时访问或修改同一个页面。
内存访问延迟：页面迁移可能会导致内存访问延迟，因为迁移过程中需要复制页面的数据或更新相关的数据结构。在进行页面迁移时，需要考虑系统的负载和性能需求，以避免过多的内存访问延迟对系统性能造成负面影响。
迁移策略选择：选择合适的页面迁移策略对于迁移的效果至关重要。不同的策略可能会根据系统的特点和需求进行选择，例如基于页面访问频率、页面脏状态、页面大小等进行决策。
错误处理：在页面迁移的过程中，可能会发生错误，例如迁移过程中的内存错误或其他异常情况。需要有相应的错误处理机制来处理这些错误，例如回滚迁移操作或进行适当的错误处理。

总之，页面迁移是一项复杂的任务，需要综合考虑各种因素，并采取适当的措施来确保迁移过程的正确性和性能。在实际应用中，需要根据具体的场景和需求，结合系统的特点来进行页面迁移的规划和实施。

内存规整

1．内存规整是基于什么原理来实现的？

答：
内存规整是一种内存管理技术，旨在优化内存的使用和分配，减少内存碎片。它基于以下原理来实现：

连续内存分配：内存规整的目标之一是获得连续的内存空间，以满足大块内存的分配需求。通过对内存进行规整，可以将散乱的小块内存合并为更大的连续内存块，提供更大的可用内存空间。
内存块合并和分割：内存规整通过合并相邻的空闲内存块来减少内存碎片。当有连续的空闲内存块时，内存规整可以将它们合并为一个更大的内存块，以提供更大的连续内存空间。相反，当需要分配小块内存时，内存规整可以将一个大的内存块分割为多个较小的内存块，以满足分配需求。
空闲内存管理：内存规整需要跟踪和管理空闲内存的状态和位置。通常使用数据结构（如链表或位图）来记录空闲内存块的位置和大小。这样可以快速找到合适大小的内存块，并进行合并或分割操作。

通过以上原理，内存规整可以提高内存的利用率，减少内存碎片，并提供更大和连续的内存空间。这对于提高系统的性能和资源管理非常重要。不同的内存规整算法和策略可以根据具体的需求和场景进行选择和优化。

2．如何触发内存规整？

答：
内存规整（Memory Defragmentation）是一种优化内存分配的操作，用于减少内存碎片并提高内存的连续性。在Linux系统中，可以通过以下方式触发内存规整：

重新启动系统：重新启动系统是最简单的触发内存规整的方法之一。当系统重新启动时，所有的内存都会被释放，并重新进行内存分配，从而实现内存的规整。
使用内存回收工具：Linux系统提供了一些内存回收工具，如 sysctl 命令和 /proc/sys/vm 目录下的参数，可以通过调整这些参数来触发内存规整。例如，通过设置 vm.drop_caches 参数为3，可以清除页面缓存和目录项缓存，从而释放一些内存并实现内存规整。
使用内存碎片整理工具：有一些专门的工具可以对内存进行碎片整理操作，例如 defrag 和 fragview 等。这些工具可以对内存进行扫描和整理，以减少内存碎片并提高内存的连续性。
动态内存分配库：在应用程序中，可以使用一些动态内存分配库，如jemalloc、tcmalloc等，它们提供了更高级的内存管理功能，包括内存碎片整理。通过使用这些库，可以在应用程序运行时触发内存规整操作。

需要注意的是，内存规整是一种系统级的操作，可能会影响系统性能和应用程序的正常运行。在触发内存规整之前，建议评估系统的内存使用情况和性能需求，并谨慎选择合适的方法和工具来进行内存规整操作。

3．哪些页面适合做内存规整？哪些页面不适合做内存规整？

答：
内存规整（Memory Defragmentation）是一种优化内存分配的操作，用于减少内存碎片并提高内存的连续性。在进行内存规整时，有一些页面适合进行规整，而有些页面则不适合。

适合进行内存规整的页面包括：

内存碎片较多的页面：内存碎片指的是存在于内存中的不连续的小块空闲内存。这些碎片化的页面可以通过内存规整来合并或重组，以提供更大的连续内存块。
内存空闲较多的页面：如果一个页面几乎没有被使用，或者被标记为空闲状态，那么它是进行内存规整的候选页面。通过将这些页面进行规整，可以更好地利用内存资源。
频繁分配和释放的页面：如果一个页面经常被分配和释放，可能会导致内存碎片的产生。对于这些页面，进行内存规整可以减少碎片，提高内存分配的效率。

不适合进行内存规整的页面包括：

正在使用的活跃页面：如果一个页面正在被频繁访问和使用，进行内存规整可能会导致性能下降。这些页面应该保持在内存中，以便快速访问和使用。
IO缓存页面：IO缓存页面用于缓存磁盘读取和写入的数据。这些页面通常被频繁访问，进行内存规整可能会导致IO性能下降。
内核数据结构页面：内核中的一些数据结构页面，如页表、中断描述符表等，通常需要保持在内存中，并且不适合进行内存规整。

需要根据具体的系统和应用场景来决定哪些页面适合进行内存规整。在进行内存规整之前，建议评估系统的内存使用情况和性能需求，并谨慎选择合适的页面进行规整操作。

KSM（Kernel SamePage Merging）

1．KSM是基于什么原理来合并页面的？

答：
KSM（Kernel SamePage Merging）是一种Linux内核中的内存优化技术，它基于页面内容的相似性原理来合并页面。

KSM的工作原理如下：

扫描页面：KSM首先会扫描系统中的页面，检查它们的内容是否相似。
相似性检测：KSM使用一种称为内存内容指纹（Memory Content Fingerprint）的技术，对页面的内容进行哈希计算，生成唯一的指纹。
页面合并：KSM将具有相同指纹的页面标记为"合并候选"，并将它们放入一个合并队列。
合并操作：KSM周期性地从合并队列中选择一对合并候选页面，比较它们的内容并进行合并操作。合并操作会将两个页面合并为一个页面，并更新相应的页表映射关系。

通过这种方式，KSM可以减少系统中重复内容的页面数量，从而节省内存空间。KSM主要用于虚拟化环境中，例如多个虚拟机之间共享相似的操作系统和应用程序代码。通过合并相似的页面，KSM可以显著降低内存的消耗，并提高系统的性能和效率。

参考链接：
内存页面共享-KSM

2．内容相同的页面在KSM里是如何被扫描和合并的？其工作流程是怎么样的？

答：
KSM（Kernel Samepage Merging）是Linux内核中的一项功能，用于合并具有相同内容的页面，以减少内存使用。下面是KSM的工作流程：

扫描相同内容的页面：KSM会周期性地扫描系统中的页面，查找具有相同内容的页面。这些页面可能来自不同的进程，但它们的内容是相同的。
页面哈希：KSM使用哈希算法对页面的内容进行哈希计算，生成唯一的哈希值。相同内容的页面将具有相同的哈希值。
页面比较：KSM将具有相同哈希值的页面进行比较，以确保它们的内容确实相同。这一步骤可以避免误判，并确保只有内容相同的页面才会被合并。
页面合并：一旦确认页面的内容相同，KSM将这些页面进行合并。合并操作将创建一个共享的页面，多个进程可以共享同一个物理页面，而不需要每个进程都拥有一份独立的页面。
页面保护：KSM会确保页面在合并后保持一致性和完整性。它会使用写时复制（Copy-on-Write）机制，以防止页面被修改时引起的冲突。

通过这个工作流程，KSM可以减少系统中相同内容页面的重复存储，从而节省内存空间。KSM通常在虚拟化环境中或者具有大量相似工作负载的系统中发挥作用，例如多个虚拟机运行相同操作系统时，它们的内存页面往往具有相同的内容。

3．若稳定的节点的hlist中堆积了几百万个rmap_item，那么对系统会产生什么影响？

答：
如果稳定的节点的hlist中堆积了几百万个rmap_item（页表项），会对系统产生以下影响：

内存占用：每个rmap_item都需要一定的内存空间来存储页表信息。如果堆积了几百万个rmap_item，将会消耗大量的内存资源。这可能导致系统内存不足，从而影响系统的性能和稳定性。
内存访问效率：当hlist中的rmap_item数量过多时，系统需要遍历整个链表来查找特定的rmap_item，这会增加内存访问的时间和开销。这可能导致系统的响应时间变慢，降低系统的整体性能。
内核调度延迟：当hlist中的rmap_item数量庞大时，对于内核进行页表操作（如映射和解除映射）的开销也会增加。这可能导致内核调度的延迟，从而影响系统的实时性能和响应能力。
系统稳定性：如果rmap_item堆积过多，可能会导致页表操作的错误或异常。这可能引发内存管理的问题，例如页面泄漏或页面访问冲突，进而导致系统的崩溃或不稳定。

因此，堆积了几百万个rmap_item可能会对系统的内存占用、内存访问效率、内核调度延迟和系统稳定性产生负面影响。为了避免这种情况发生，需要进行合理的内存管理和调优，以确保系统的正常运行。

4．新版本的KSM对稳定的节点做了哪些优化？

答：
新版本的KSM（Kernel Samepage Merging）对稳定的节点进行了一些优化，以提高其性能和效率。以下是一些新版本KSM对稳定节点的优化：

增量扫描：新版本的KSM引入了增量扫描机制，即只扫描最近修改过的页，而不是遍历整个内存。这样可以减少扫描的开销，提高扫描效率。
定期扫描：新版本的KSM引入了定期扫描机制，即定期触发对稳定节点的扫描。这样可以避免不必要的扫描，减少对系统资源的占用。
精确匹配：新版本的KSM改进了页面匹配算法，提高了页面匹配的准确性。这样可以更精确地识别出可以合并的页面，减少误判和不必要的合并操作。
并发处理：新版本的KSM支持并发处理，可以同时处理多个稳定节点。这样可以提高合并操作的并发性和效率。
内存限制：新版本的KSM引入了内存限制机制，可以限制KSM合并操作所占用的内存资源。这样可以避免KSM过度占用内存，影响系统的性能和稳定性。

这些优化措施使新版本的KSM在合并稳定节点时更加高效和可靠，减少了不必要的扫描和合并操作，提高了系统的性能和资源利用率。需要注意的是，具体的优化细节可能会因Linux内核版本和配置而有所不同。

36．如果多个VMA的虚拟页面同时映射了同一个匿名页面，那么此时page->index应该等于多少？

答：
如果多个VMA的虚拟页面同时映射了同一个匿名页面，那么此时page->index应该等于0。在Linux内核中，page结构体中的index字段用于表示页面在匿名页面的索引位置。对于匿名页面，index字段通常被设置为0，因为它没有特定的索引值，而是被多个VMA共享。因此，当多个VMA的虚拟页面同时映射了同一个匿名页面时，它们对应的page结构体中的index字段都会被设置为0。

38．页面分配器如何管理空闲页面和分配请求之间的关系？

答：
页面分配器是操作系统中的内存管理组件，负责管理空闲页面和分配请求之间的关系。它主要通过以下方式来管理这种关系：

空闲页面列表：页面分配器会维护一个空闲页面列表，记录系统中当前可用的空闲页面。这个列表可以是一个链表、位图或其他数据结构。分配器会根据需要从列表中分配页面，并将已使用的页面从列表中移除。
页面分割和合并：当分配请求到来时，页面分配器会根据请求的大小从空闲页面中选择一个合适的页面进行分配。如果选择的页面比请求的大小大，则可能需要将页面进行分割，将多余的部分重新放回空闲页面列表。相反，如果选择的页面比请求的大小小，则可能需要将多个页面合并成一个更大的页面，以满足分配请求。
内存碎片管理：页面分配器会尽量减少内存碎片的产生。内存碎片是指由于页面分割和合并导致的未被完全利用的内存空间。分配器会根据需要进行内存碎片整理，将多个小的空闲页面合并成更大的页面，以提供更大的连续内存空间。
分配算法：页面分配器会使用不同的算法来选择合适的页面进行分配。常见的算法包括首次适应（First Fit）、最佳适应（Best Fit）和最坏适应（Worst Fit）等。这些算法根据页面大小和空闲页面列表的状态来选择最合适的页面。

通过以上方式，页面分配器能够有效地管理空闲页面和分配请求之间的关系，以满足进程对内存的分配需求，并最大程度地利用可用的内存空间。

40．当一个普通的进程恶意占用内存时，页面分配器是如何处理的？

答：
当一个普通的进程恶意占用内存时，页面分配器会尝试通过以下方式来处理：

内存压力管理：当进程占用大量内存时，系统的可用内存可能会减少，导致内存压力增加。页面分配器会根据内存压力管理策略来调整内存分配行为。它可以通过增加页面回收的频率或使用更严格的页面置换策略来释放被占用的内存。
内存回收：页面分配器会尝试回收被进程占用的页面，以便重新分配给其他进程使用。它会检测不再使用的页面，将其标记为可回收，并尝试通过页面置换或页面交换来释放这些页面。
OOM（Out-of-Memory）管理：如果占用内存的进程导致系统内存不足，页面分配器可能会触发OOM管理机制。OOM管理会选择一个或多个进程进行终止，以释放内存并保证系统的正常运行。选择哪个进程终止通常基于一些策略，例如选择占用内存最多的进程或最近使用最少的进程。

需要注意的是，页面分配器的处理方式可能会因操作系统和具体的内存管理策略而有所不同。此外，恶意占用内存的进程可能会使用一些技巧来规避页面分配器的处理，这需要综合考虑其他安全机制和监控措施来应对恶意行为。

41．若一个普通进程处于内存承压的情况下，页面分配器尝试哪些努力来保证分配成功？

答：
当一个普通进程处于内存承压的情况下，页面分配器会尝试以下努力来保证分配成功：

内存回收：页面分配器会尝试回收不再使用的页面，以释放内存空间。它会检测那些被进程释放或不再需要的页面，并将其标记为可回收。通过页面回收，页面分配器可以获得更多可用的内存供其他进程使用。
页面置换：当系统内存不足时，页面分配器可能会触发页面置换机制。它会选择一些较少使用的页面，并将它们置换出去，以腾出内存空间来分配给需要的进程。页面置换通常会遵循一些策略，例如LRU（最近最少使用）算法，选择最久未被访问的页面进行置换。
内存压缩：在某些情况下，页面分配器可能会尝试使用内存压缩技术来释放内存空间。内存压缩可以通过对进程的内存页面进行压缩和重组，以减少内存占用。这可以临时提供更多的可用内存，延迟或避免页面置换的发生。
内存扩展：如果以上努力仍然无法满足内存分配需求，页面分配器可能会尝试通过内存扩展来增加系统的可用内存。这可以包括从交换空间（swap）中获取额外的内存，或者通过动态分配更多的物理内存来满足进程的需求。

页面分配器会根据系统的内存管理策略和当前的内存压力情况，综合考虑以上努力来尽可能保证内存分配的成功。然而，如果系统内存压力过大或者资源有限，可能仍然无法满足所有进程的需求。在这种情况下，可能会出现内存分配失败或延迟的情况。

42．在什么情况下页面分配器可以访问系统预留内存？

答：
当一个普通进程处于内存承压的情况下，页面分配器会尝试以下努力来保证分配成功：

内存回收：页面分配器会尝试回收不再使用的页面，以释放内存空间。它会检测那些被进程释放或不再需要的页面，并将其标记为可回收。通过页面回收，页面分配器可以获得更多可用的内存供其他进程使用。
页面置换：当系统内存不足时，页面分配器可能会触发页面置换机制。它会选择一些较少使用的页面，并将它们置换出去，以腾出内存空间来分配给需要的进程。页面置换通常会遵循一些策略，例如LRU（最近最少使用）算法，选择最久未被访问的页面进行置换。
内存压缩：在某些情况下，页面分配器可能会尝试使用内存压缩技术来释放内存空间。内存压缩可以通过对进程的内存页面进行压缩和重组，以减少内存占用。这可以临时提供更多的可用内存，延迟或避免页面置换的发生。
内存扩展：如果以上努力仍然无法满足内存分配需求，页面分配器可能会尝试通过内存扩展来增加系统的可用内存。这可以包括从交换空间（swap）中获取额外的内存，或者通过动态分配更多的物理内存来满足进程的需求。

43．在页面分配器中，分配掩码ALLOC_HIGH、ALLOC_HARDER、ALLOC_OOM以及ALLOC_NO_WATERMARKS之间有什么区别？它们各自能访问系统预留内存的百分比是多少？思考为什么页面分配器需要做这样的安排。

答：
在Linux内核的页面分配器中，分配掩码（Allocation Mask）ALLOC_HIGH、ALLOC_HARDER、ALLOC_OOM和ALLOC_NO_WATERMARKS用于控制内存分配的行为。它们之间的区别如下：

ALLOC_HIGH：这个分配掩码用于请求较高优先级的内存分配。它会尝试从系统的预留内存池中分配页面，而不会触发内存回收或页面置换。它适用于对内存分配延迟敏感的任务，例如关键任务或实时任务。
ALLOC_HARDER：这个分配掩码用于请求较高优先级的内存分配，但相对于ALLOC_HIGH，它的分配策略更加严格。它会尝试从系统的预留内存池中分配页面，但在分配失败时会更加努力地进行内存回收和页面置换。它适用于对内存分配延迟要求较高的任务。
ALLOC_OOM：这个分配掩码用于请求内存分配时，即使系统内存不足，也不会触发OOM（Out-of-Memory）条件。它会尽最大努力进行内存回收和页面置换，以尝试满足分配请求。它适用于对内存分配容错性要求较高的任务。
ALLOC_NO_WATERMARKS：这个分配掩码用于请求内存分配时，不考虑系统的内存水位线（watermarks）。它会尽最大努力进行内存回收和页面置换，以尝试满足分配请求。它适用于对内存分配灵活性要求较高的任务。

每个分配掩码对应的系统预留内存百分比没有固定的具体值，因为它们是根据系统配置和内存管理策略动态调整的。它们的具体值会根据系统的内存压力、可用内存量以及分配请求的优先级等因素来确定。

页面分配器需要做这样的安排是为了满足不同任务对内存分配的不同要求。不同的任务可能对内存分配的延迟、容错性或灵活性有不同的需求。通过提供不同的分配掩码，页面分配器可以根据任务的优先级和要求来调整内存分配的策略，以尽可能满足任务的需求并保持系统的内存稳定性和性能。

44．伙伴系统算法是如何减少内存碎片的？

答：
伙伴系统算法是一种常用的内存分配算法，用于减少内存碎片的产生。它的主要思想是将内存空间划分为不同大小的内存块，并以2的幂次方进行划分（例如，4KB、8KB、16KB等）。以下是伙伴系统算法的工作原理：

初始化内存池：在系统启动时，将整个可用内存划分为最大的内存块，并将其标记为可用。
分配内存块：当需要分配一块特定大小的内存时，伙伴系统会根据请求的大小选择一个合适的内存块。如果没有完全匹配的内存块，它会选择一个稍大的内存块，并将其一分为二，直到找到一个合适大小的内存块。
合并内存块：当释放一个内存块时，伙伴系统会检查其相邻的内存块是否也是空闲的，并尝试将它们合并成一个更大的内存块。这样可以减少内存碎片的产生，提供更大的连续内存块。
分割内存块：如果有一个大的内存块被分配，但只使用了一部分，伙伴系统会将其分割成两个较小的内存块，并将其中一个标记为已分配，另一个标记为空闲。

通过不断地合并和分割内存块，伙伴系统算法可以最大程度地利用可用内存，减少内存碎片的产生。这种算法能够提供高效的内存分配和管理，使得操作系统能够更好地满足不同大小内存请求的需求。

45．为什么要把内存分成不同的迁移类型？这些迁移类型有什么区别？

答：
将内存分成不同的迁移类型是为了更好地管理和优化内存分配和迁移操作。不同的迁移类型具有不同的特性和行为，以适应不同的内存管理需求。以下是一些常见的迁移类型及其区别：

MOVABLE（可迁移）：这种迁移类型的页面可以被移动到系统的任何位置，而不会导致系统的不稳定或性能下降。可迁移页面通常用于支持动态内存分配和迁移操作，例如内存热插拔、内存压缩和内存回收等。
UNMOVABLE（不可迁移）：这种迁移类型的页面不允许被移动。不可迁移页面通常用于存储关键系统数据、设备驱动程序和固定映射的内存区域等，这些页面对于系统的稳定性和性能是至关重要的，不应被移动。
RECLAIMABLE（可回收）：这种迁移类型的页面可以被回收，即从系统中释放并重新分配给其他需要的任务。可回收页面通常用于存储临时数据、缓存和未经修改的文件页等，这些页面可以根据系统需要进行回收以释放内存空间。
MIGRATEABLE（可迁移和可回收）：这种迁移类型的页面既可以被移动，也可以被回收。可迁移和可回收页面通常用于一些中间状态，例如在进行页面迁移或回收操作时，页面可能暂时具有这种迁移类型。

通过将内存分成不同的迁移类型，内核可以更好地管理内存分配、迁移和回收操作，以满足系统的稳定性、性能和资源管理需求。不同的迁移类型允许内核在不同的场景下灵活地操作内存，并确保关键数据的安全性和可用性。

46．假设请求分配order为4的一个内存块，迁移类型是不可迁移（MIGRATE_UNMOVABLE），但是order大于或等于4的不可迁移类型的空闲链表中没有空闲页块，那么页面分配器会怎么办？

答：
如果请求分配order为4的内存块，并且指定迁移类型为不可迁移（MIGRATE_UNMOVABLE），但是不可迁移类型的空闲链表中没有足够的空闲页块，页面分配器会尝试执行以下步骤：

尝试进行内存紧缩（memory compaction）：内存紧缩是一种尝试重新排列内存页面，以使空闲页面尽可能连续的技术。页面分配器会尝试通过内存紧缩来释放和合并页面，以获得足够的连续内存块来满足请求。
尝试进行内存回收：页面分配器会尝试回收不再使用的内存页，例如通过释放未使用的页面或将页面移动到交换空间（swap）中。这样可以重新组织内存，以获得连续的内存块。
尝试从其他迁移类型的空闲链表中获取内存块：如果不可迁移类型的空闲链表中没有足够的内存块，页面分配器可能会尝试从其他迁移类型的空闲链表中获取内存块。例如，它可以尝试从可迁移（MIGRATE_MOVABLE）或可回收（MIGRATE_RECLAIMABLE）类型的空闲链表中获取内存块。

如果上述步骤都无法满足请求，页面分配器将返回分配失败的结果，指示无法分配所需的内存块。这可能会导致请求的操作无法继续执行，或者需要采取其他措施来处理内存不足的情况。具体的行为可能会因Linux内核版本和配置而有所不同。

47．什么是内存外碎片化？Linux内核的页面分配器是如何发现外碎片的？

答：
内存外碎片化是指在内存管理过程中，存在大量不连续的小块空闲内存，无法满足大块连续内存分配的情况。这种情况下，虽然总的空闲内存足够，但由于内存分散成多个碎片，无法满足某些需要连续内存的应用或进程的需求。

在Linux内核中，页面分配器负责管理内存的分配和回收。页面分配器通过维护一个内存空闲列表来跟踪内存的使用情况。当需要分配内存时，页面分配器会搜索空闲列表，尝试找到一个足够大且连续的内存块来满足请求。

页面分配器通常使用一种称为伙伴系统（buddy system）的算法来管理内存。该算法将内存划分为不同大小的内存块，并以2的幂次方的方式进行划分（例如，4KB、8KB、16KB等）。当内存分配器需要分配一块特定大小的内存时，它会搜索相应大小的内存块链表，尝试找到合适的内存块。

发现外碎片的过程是通过遍历空闲列表来进行的。当页面分配器无法找到足够大的连续内存块时，它会检查空闲列表中的碎片情况。如果存在外碎片（即空闲内存块不连续），页面分配器将采取相应的处理方法，如合并相邻的小块内存、回收未使用的页面或进行内存紧缩等，以尽量减少外碎片的数量。

需要注意的是，具体的页面分配器实现和算法可能会因Linux内核版本和配置而有所不同，但总体思路是通过管理空闲列表来发现和处理外碎片。

48．当发现了内存外碎片，Linux 5.0内核是如何处理的？

答：
当Linux内核发现内存外碎片时，它会尝试通过内存管理机制来处理。下面是一些常见的处理方法：

内存回收：Linux内核会尝试回收不再使用的内存页，例如通过释放未使用的页面或者将页面移动到交换空间（swap）中。这样可以将内存重新组织，以减少外碎片的数量。
页面合并：内核可能会尝试将相邻的小块内存合并成较大的连续内存块。这样可以减少外碎片的数量，并提供更大的连续内存空间。
内存紧缩：当内存碎片较多且无法通过回收或合并解决时，内核可能会尝试使用内存紧缩（memory compaction）技术。内存紧缩会尝试重新排列内存页面，使得空闲页面尽可能连续，从而减少外碎片。
内存分配策略：内核还可以采用不同的内存分配策略，例如首次适应（first-fit）、最佳适应（best-fit）或最差适应（worst-fit）等，以减少内存碎片的产生。

需要注意的是，具体的内存管理策略和处理方法可能会因Linux内核版本和配置而有所不同。因此，处理内存外碎片的具体细节可能会有所差异。

内存管理实战

1．Linux内核的内存管理模块都对哪些页面进行了统计？

答：
Linux内核的内存管理模块对以下页面进行了统计：

空闲页面：没有被占用的页面。
可用页面：已经被分配但还没有被使用的页面。
已用页面：已经被分配并且正在被使用的页面。
匿名页面：没有与文件系统关联的页面，通常用于进程堆栈、共享内存等。
文件页面：与文件系统关联的页面，通常用于文件缓存。
缓冲页面：用于I/O缓冲，包括文件缓存和块设备缓存。
内核页面：内核代码和数据所在的页面。
不可交换页面：不能被交换到磁盘的页面，通常是内核代码和数据、I/O缓冲等。
可交换页面：可以被交换到磁盘的页面，通常是进程堆栈、共享内存等。

2．请解释/proc/meminfo节点中每一项的含义。

答：

统计项	内容	描述
MemTotal:	行1，列2	系统当前可用物理内存总量，通过读取全局变量_totalram_pages来获得
MemFree:	行2，列2	系统当前剩余空闲物理内存，通过读取全局变量vm_zone_stat[]数组中的NR_FREE_PAGES来获得
MemAvailable:	行3，列2	1) 系统中可使用页面的数量，由si_mem_available()函数来计算。 2) 公式为Available = memfree + pagecache + reclaimable−totalreserve_pages。 3) 这里包括了空闲页面（memfree）、文件映射页面（pagecache）、可回收的页面（reclaimable），最后减去系统保留的页面
Buffers:	行1，列2	`用于块层的缓存`，由nr_blockdev_pages()函数来计算
Cached:	行2，列2	`用于页面高速缓存的页面`。计算公式为Cached = NR_FILE_PAGES – swap_cache − Buffers
SwapCached:	行1，列2	这里统计交换缓存的数量，交换缓存类似于内容缓存，只不过它对应的是交换分区，而内容缓存对应的是文件。这里表示匿名页面曾经被交换出去，现在又被交换回来，但是页面内容还在交换缓存中
Active:	行2，列2	行2，列3
Inactive:	行3，列2	行3，列3
Active(anon):	行1，列2	行1，列3
Inactive(anon):	行2，列2	行2，列3
Active(file):	行1，列2	行1，列3
Inactive(file):	行2，列2	行2，列3
Unevictable:	行3，列2	行3，列3
Mlocked:	行1，列2	行1，列3
SwapTotal:	行2，列2	行2，列3
SwapFree:	行1，列2	行1，列3
Dirty:	行2，列2	行2，列3
Writeback:	行3，列2	行3，列3
AnonPages:	行1，列2	行1，列3
Mapped:	行2，列2	行2，列3
Shmem:	行1，列2	行1，列3
KReclaimable:	行2，列2	行2，列3
SReclaimable:	行3，列2	行3，列3
SUnreclaim:	行1，列2	行1，列3
KernelStack:	行2，列2	行2，列3
PageTables:	行2，列2	行2，列3
NFS_Unstable:	行2，列2	行2，列3
Bounce:	行2，列2	行2，列3
WritebackTmp:	行2，列2	行2，列3
CommitLimit:	行2，列2	行2，列3
Committed_AS:	行2，列2	行2，列3
VmallocTotal:	行2，列2	行2，列3
VmallocUsed:	行2，列2	行2，列3
VmallocChunk:	行2，列2	行2，列3
Percpu:	行2，列2	行2，列3
IonTotalCache:	行2，列2	行2，列3
IonTotalUsed:	行2，列2	行2，列3
CmaTotal:	行2，列2	行2，列3
FastRPCUsed:	行2，列2	行2，列3
KgslCache:	行2，列2	行2，列3
DefragPoolFree:	行2，列2	行2，列3
RealMemFree:	行2，列2	行2，列3

3．为什么/proc/meminfo节点中的MemTotal不等于物理内存？

答：
在Linux系统中，/proc/meminfo节点提供了有关系统内存使用情况的信息。其中，MemTotal字段表示系统的总内存大小。然而，/proc/meminfo中的MemTotal并不一定等于物理内存的总大小，这可能会引起一些困惑。

这是因为在Linux系统中，除了物理内存（RAM）之外，还存在其他类型的内存，如虚拟内存、内核内存等。而/proc/meminfo中的MemTotal字段包括了所有这些类型的内存。

具体来说，/proc/meminfo中的MemTotal字段包括了以下几个方面的内存：

物理内存（RAM）：这是系统中实际的物理内存大小。
内核保留内存：内核需要保留一部分内存来管理系统的运行。这些内存通常用于内核数据结构、页表等。
内核映射内存：内核还会将一部分内存映射到内核空间，以便访问和操作。
内核堆栈：内核需要为每个运行的进程分配一些内存作为内核堆栈。
虚拟内存：虚拟内存是指通过内存管理机制将磁盘上的数据映射到内存中，以提供更大的地址空间。

因此，/proc/meminfo中的MemTotal字段包含了除物理内存之外的其他类型内存的大小，所以它可能会大于物理内存的总大小。如果只关注物理内存大小，可以使用其他工具或命令（如free、top）来获取物理内存的准确信息。

4．为什么slab要区分SReclaimable和SUnreclaim？

答：
slab是Linux内核中用于管理内核对象分配的内存缓存机制。在slab分配器中，为了更好地管理和优化内存使用，将内存缓存分为SReclaimable和SUnreclaim两种类型。

SReclaimable：这是可回收的内存缓存类型，它包含了可以被回收和释放的内存对象。这些内存对象通常是内核中的缓存数据结构，例如文件系统缓存、目录项缓存等。当系统内存紧张时，内核可以主动回收这些SReclaimable缓存，以释放内存供其他用途使用。

SUnreclaim：这是不可回收的内存缓存类型，它包含了不应该或不方便回收的内存对象。这些内存对象通常是内核中的重要数据结构，例如进程描述符、页表等。由于这些内存对象的特殊性，回收它们可能会导致系统不稳定或性能下降，因此被标记为不可回收。

区分SReclaimable和SUnreclaim的目的是为了更好地管理内存和提高系统性能。SReclaimable缓存可以根据系统内存需求进行主动回收，以释放可用内存。而SUnreclaim缓存则被视为重要的内核数据结构，通常不会被回收，以确保系统的稳定性和正常运行。

需要注意的是，具体的内存缓存分类和管理策略可能会因Linux内核版本和配置而有所不同。这是为了根据系统需求和场景进行灵活的内存管理和优化。

5．在/proc/meminfo节点中，为什么Activeanon)+Inactive(anon)不等于AnonPages？

答：
在/proc/meminfo节点中，Active(anon) + Inactive(anon) 不等于 AnonPages 的原因是它们代表了不同的匿名内存使用情况。

Active(anon) 表示已经被使用且仍然活跃的匿名内存页。这些是最近被访问过的匿名页，仍然在内存中保持活跃状态，以便快速访问。
Inactive(anon) 表示已经被使用但目前不活跃的匿名内存页。这些匿名页在过去被访问过，但目前处于不活跃状态，可以被回收以释放内存。

相比之下，AnonPages 表示当前进程使用的匿名内存页的总大小，包括了活跃的和不活跃的匿名页。

Active(anon) + Inactive(anon) 代表了当前系统中被使用的匿名内存页的总大小，而 AnonPages 表示了当前进程使用的匿名内存页的总大小。

需要注意的是，这些值都是动态变化的，表示系统或进程当前的内存使用情况。具体的数值可能会因为系统活动和内存管理策略的调整而有所变化。因此，在具体情况下，这些值可能会有所不同，但它们的总体含义和解释保持不变。

6．在/proc/meminfo节点中，为什么Active(file) + Inactive(file)不等于Mapped？

答：
在/proc/meminfo节点中，Active(file) + Inactive(file)不等于Mapped的原因是它们代表了不同的内存使用情况。

Active(file)表示已经被使用且仍然活跃的文件缓存。这些是最近被访问过的文件页，仍然在内存中保持活跃状态，以便快速访问。
Inactive(file)表示已经被使用但目前不活跃的文件缓存。这些文件页在过去被访问过，但目前处于不活跃状态，可以被回收以释放内存。

相比之下，Mapped表示当前映射到进程虚拟地址空间的文件页的总大小，包括了活跃的和不活跃的文件页。

Active(file) + Inactive(file)代表了当前系统中被使用的文件缓存的总大小，而Mapped表示了当前进程虚拟地址空间中映射的文件页的总大小。

7．在/proc/meminfo节点中，为什么Active(file) + Inactive(file)不等于Cached？

答：
在/proc/meminfo节点中，Active(file)表示已经被使用且仍然活跃的文件缓存，而Inactive(file)表示已经被使用但目前不活跃的文件缓存。Cached表示系统中缓存的文件页和目录项的总大小。

Active(file) + Inactive(file)并不等于Cached的原因是，Cached包括了除文件缓存之外的其他缓存，例如目录项缓存和页面缓存。这些缓存可能由于不同的原因而被标记为活跃或不活跃。

另外，Active(file)和Inactive(file)是根据最近的访问情况来判断的，而Cached是根据整个系统的缓存情况来计算的。因此，在某个特定时间点上，Active(file) + Inactive(file)的总和可能与Cached不完全一致。

需要注意的是，/proc/meminfo中的值是动态变化的，表示系统当前的内存使用情况。不同的内核版本和配置可能会对这些值进行微调或调整。因此，在具体情况下，这些值可能会有所不同，但它们的总体含义和解释保持不变。

8．/proc/PID/status（PID表示进程的ID）节点中有不少和具体进程内存相关的信息，请简述这些信息的含义。

答：
在/proc/PID/status节点中，有一些与具体进程内存相关的信息，以下是这些信息的含义：

VmPeak：进程创建以来虚拟内存峰值的大小，即进程所使用的虚拟内存的最大值。
VmSize：进程当前使用的虚拟内存大小，包括进程的代码、数据、堆栈以及共享库等。
VmLck：进程使用的锁定内存的大小，锁定内存是指无法被换出到磁盘的内存。
VmPin：进程使用的固定内存的大小，固定内存是指无法被换出到磁盘的内存，但可以被锁定和解锁。
VmHWM：进程创建以来使用的物理内存的峰值大小，即进程所使用的实际物理内存的最大值。
VmRSS：进程当前使用的物理内存大小，即进程实际占用的物理内存大小。
RssAnon：进程使用的匿名内存的大小，匿名内存是指没有对应文件映射的内存。
RssFile：进程使用的文件映射内存的大小，文件映射内存是指与文件关联的内存。
RssShmem：进程使用的共享内存的大小，共享内存是指多个进程共享的内存。
VmData：进程数据段（data segment）的大小，包括进程的全局变量、静态变量等。
VmStk：进程堆栈（stack）的大小，堆栈是用于存储函数调用和局部变量的内存区域。

这些信息提供了关于进程内存使用情况的一些指标，可以帮助了解进程的内存占用情况以及内存分布情况。通过查看这些信息，可以对进程的内存使用情况进行监控和分析。

9．/proc/meminfo节点中SwapTotal减去SwapFree等于系统中已经使用的swap内存大小，我们称之为S_swap。另外，我们写一个小程序来遍历系统中所有的进程，并把进程中/proc/PID/status节点的VmSwap值都累加起来，我们把它称为P_swap，为什么这两个值不相等？

答：
S_swap和P_swap的不相等可能是由于以下原因：

Kernel内部使用：/proc/meminfo中的SwapTotal和SwapFree是内核统计的整个系统的swap内存使用情况。它们反映了内核对swap内存的管理情况，包括已经分配和正在使用的swap内存。而P_swap是通过遍历每个进程的VmSwap值来计算的，它只统计了进程自身使用的swap内存，不包括内核使用的swap内存。
共享swap内存：多个进程可能共享同一个swap内存页面。在P_swap的计算中，每个进程的VmSwap值是独立统计的，而实际上它们可能共享同一个swap内存页面。因此，P_swap的累加值可能会超过S_swap，因为它重复计算了共享的swap内存页面。
临时使用的swap内存：内核可能会临时使用swap内存作为缓存或临时存储空间。这些临时使用的swap内存不会被计入P_swap中，因为它们不属于任何进程的VmSwap值。

综上所述，S_swap和P_swap不相等是因为它们统计的范围和计算方法不同。S_swap是整个系统的swap内存使用情况，包括内核使用的和进程使用的，而P_swap只统计了每个进程自身使用的swap内存，不包括共享的和内核临时使用的swap内存。

10．请简述min_free_kbytes的含义和作用。

答：
min_free_kbytes是一个内核参数，用于控制Linux内核中的最小空闲内存大小。它的含义和作用如下：

含义：min_free_kbytes用于指定系统中保留的最小空闲内存大小。这个数值以字节为单位，表示系统中至少要保留多少空闲内存。
作用：min_free_kbytes的作用是确保系统在面临内存压力时，仍然保留足够的空闲内存供系统使用。这样可以避免系统因为内存不足而导致的性能下降、系统崩溃或交换（swap）过度使用。

当系统的可用内存低于设定的min_free_kbytes值时，内核会采取措施来确保至少有min_free_kbytes的空闲内存可供使用。这可能涉及到内存回收、页面置换或者触发OOM（Out-of-Memory）机制。

需要注意的是，min_free_kbytes的取值应该根据具体的系统配置和需求进行调整。设置过小的min_free_kbytes可能导致系统频繁进行内存回收和页面置换，影响系统性能。而设置过大的min_free_kbytes可能会浪费内存资源。因此，需要根据实际情况进行权衡和调整。

11．请简述lowmem_reserve_ratio的含义和作用。

答：
lowmem_reserve_ratio是一个内核参数，用于控制Linux内核中的低内存保留比例。它的含义和作用如下：

含义：lowmem_reserve_ratio用于指定系统中低内存的保留比例。低内存是指系统中较为紧张和有限的物理内存区域，通常用于操作系统内核和关键系统组件的运行。
作用：lowmem_reserve_ratio决定了系统在面临内存压力时，保留多少比例的低内存不被用户空间应用程序使用。这样可以确保操作系统和关键系统组件具有足够的内存资源来维持其正常运行。

lowmem_reserve_ratio的取值范围是0到100，表示保留的比例。例如，设置为10表示保留10%的低内存不被用户空间应用程序使用。

通过设置合适的lowmem_reserve_ratio，可以避免低内存被过度消耗，以保证系统的稳定性和可靠性。然而，过高的保留比例可能会导致可用内存变少，影响系统的性能。因此，需要根据具体系统的需求和配置进行适当的调整。

12．请简述zone_reclaim_mode的含义和作用。

答：
zone_reclaim_mode是一个内核参数，用于控制Linux内核中的区域（zone）回收机制的行为。它的含义和作用如下：

含义：zone_reclaim_mode用于指定内核在面临内存压力时如何回收区域中的页面。区域是内存管理中的一个概念，用于将系统内存划分为不同的区域，例如可回收区域、不可回收区域等。
作用：zone_reclaim_mode决定了内核在进行区域回收时的行为方式。它的取值可以是以下几种：
- 0：表示禁用区域回收机制。内核将不会尝试从其他区域中回收页面来满足当前区域的内存需求。
- 1：表示启用区域回收机制。内核会尝试从其他区域中回收页面来满足当前区域的内存需求。
- 2：表示启用区域回收机制，并且内核会尽量从本地节点的其他区域中回收页面，以减少NUMA（Non-Uniform Memory Access）效应对性能的影响。

zone_reclaim_mode的设置可以根据系统的特定需求进行调整。通过启用区域回收机制，内核可以更灵活地管理内存，并尽量减少内存压力。然而，过度的区域回收可能会导致额外的开销和延迟，因此需要根据具体情况进行权衡和调整。

13．请简述watermark_boost_factor的含义和作用。

答：
watermark_boost_factor是一个内核参数，用于调整Linux内核中内存回收机制的行为。它的含义和作用如下：

含义：watermark_boost_factor表示内核在进行内存回收时，为了提高回收速度而允许的内存压力上升的因子。当系统内存压力增加时，内核会触发内存回收操作，以释放未使用的页面。watermark_boost_factor决定了内核在回收过程中承受的内存压力程度。
作用：watermark_boost_factor的值越大，表示内核在进行内存回收时愿意承受更高的内存压力。这样可以加快内存回收的速度，尽快释放未使用的页面。然而，较高的watermark_boost_factor值可能会导致内存压力增加，可能会对系统的性能产生一定的影响。

需要注意的是，watermark_boost_factor的默认值通常是1，表示内核在进行内存回收时不愿意承受额外的内存压力。如果希望加快内存回收速度，可以适当增加watermark_boost_factor的值。但应谨慎调整该参数，以避免过高的内存压力对系统性能造成不利影响。

14．请简述影响脏页回写的参数有哪些？它们的含义和作用分别是什么？

答：
影响脏页回写（Dirty Page Writeback）的参数有以下几个：

dirty_ratio（脏页比例）：该参数表示系统内存中脏页（已被修改但尚未写回磁盘的页面）所占的比例阈值。当脏页的比例超过该阈值时，系统会触发脏页回写操作。该参数的作用是控制脏页回写的触发时机，以避免过多的脏页积压。
dirty_background_ratio（后台脏页比例）：该参数表示系统内存中脏页在后台回写时所占的比例阈值。当脏页的比例超过该阈值时，系统会启动后台回写（kswapd）线程来回写脏页。该参数的作用是控制后台回写的触发时机，以平衡系统的性能和脏页回写的负载。
dirty_expire_centisecs（脏页过期时间）：该参数表示脏页的最长存留时间，以百分之一秒为单位。超过该时间的脏页将被视为过期，需要立即回写到磁盘。该参数的作用是控制脏页回写的延迟，以避免脏页在内存中过长时间积压。
dirty_writeback_centisecs（脏页回写间隔时间）：该参数表示两次脏页回写操作之间的最小时间间隔，以百分之一秒为单位。该参数的作用是限制脏页回写的频率，以避免过于频繁的回写操作对系统性能造成影响。

这些参数的设置可以通过sysctl接口进行调整，以根据系统的需求和硬件配置来优化脏页回写的行为。通过合理地调整这些参数，可以平衡系统的性能和脏页回写的负载，确保数据的持久性和系统的稳定性。