CPU--进阶知识

yaoming168

已于 2023-08-20 20:03:35 修改

阅读量592

点赞数

文章标签： linux

于 2023-06-23 10:48:18 首次发布

本文链接：https://blog.csdn.net/yaoming168/article/details/131256286

版权

CPU实战知识

1．ARM64处理器中有两个页表基地址寄存器TTBR0和TTBR1，处理器如何使用它们？
2．请简述ARM64处理器的4级页表的映射过程，假设页面粒度为4KB，地址宽度为48位。
3．在L0～L2页表项描述符中，如何判断一个页表项是块类型还是页表类型？
4．在ARM64 Linux内核中，用户空间和内核空间是如何划分的？
5．在ARM64 Linux内核中，PAGE_OFFSET表示什么意思？
6．KIMAGE_VADDR表示什么意思？
7．TEXT_OFFSET表示什么意思？
8．内核映像文件包含哪些段？这些段的作用是什么？在Sysmtem.map文件中它们分别使用哪些符号来表示段的开始和结束？
9．请画出ARM64 Linux内核的内存布局。
10．__pasymbol()宏和\_pa()宏有什么区别？
11．在物理内存还没有线性映射到内核空间时，内核映像文件映射到什么地方？
12．在ARM Linux内核中，kimage_voffset代表什么意思呢？
13．在ARMv8架构中，高速缓存管理的PoC和PoU有什么区别？
14．在ARMv8架构中，ASID是什么意思？有什么作用？
15．在ARMv8架构中支持哪几种内存属性？它们都有哪些特点？
16．在ARMv8架构中，高速缓存共享属性有内部共享（inner shareable）和外部共享（outer shareable），它们有什么区别？
17．在ARMv8架构中，支持哪几条内存屏障指令？它们都有什么区别？
18．加载-获取屏障原语与存储-释放屏障原语有什么区别？分别有什么作用？
19．什么是一个段的加载地址和运行地址？
20．从U-boot跳转到内核时，为什么指令高速缓存可以打开而数据高速缓存必须关闭？
21．在Linux内核启动汇编代码中，为什么要建立恒等映射？
22．在ARMv8架构中，在L0～L2页表项中包含了指向下一级页表的基地址，那么这个下一级页表基地址是物理地址还是虚拟地址？
23．MMU可以遍历页表，Linux内核也提供了软件遍历页表的函数，如walk_pgd()、__create_pgd_mapping()、follow_page()等。从软件的视角，Linux内核的pgd_t、pud_t、pmd_t以及pte_t数据结构中并没有存储一个指向下一级页表的指针（即从CPU角度来看，CPU访问这些数据结构时是以虚拟地址来访问的），它们是如何遍历的呢？pgd_t、pud_t、pmd_t以及pte_t数据结构是u64类型的变量。

1．ARM64处理器中有两个页表基地址寄存器TTBR0和TTBR1，处理器如何使用它们？

答：

TTBR0寄存器：TTBR0寄存器用于存储用户空间的页表基地址。当ARM64处理器执行用户空间的代码时，它会使用TTBR0寄存器中存储的页表基地址进行虚拟地址到物理地址的转换。
TTBR1寄存器：TTBR1寄存器用于存储内核空间的页表基地址。当ARM64处理器执行内核空间的代码时，它会使用TTBR1寄存器中存储的页表基地址进行虚拟地址到物理地址的转换。

通过使用两个不同的页表基地址寄存器，ARM64处理器能够实现用户空间和内核空间之间的地址隔离。这样，用户空间和内核空间可以拥有各自独立的页表，从而实现虚拟地址的隔离和保护。

需要注意的是，具体的页表结构和页表项的格式可能会因操作系统和配置而有所不同。ARM64处理器提供了灵活的页表机制，可以根据需求进行配置和扩展。

2．请简述ARM64处理器的4级页表的映射过程，假设页面粒度为4KB，地址宽度为48位。

答：
ARM64处理器的4级页表是用于虚拟地址到物理地址的映射的一种机制。假设页面粒度为4KB，地址宽度为48位，下面是4级页表的映射过程：

虚拟地址划分：根据48位的虚拟地址，将其划分为四个部分：
- 16位的L0索引：用于在第一级页表中选择一个L1页表。
- 16位的L1索引：用于在第二级页表中选择一个L2页表。
- 16位的L2索引：用于在第三级页表中选择一个L3页表。
- 12位的L3偏移：用于在第四级页表中选择一个物理页帧。
第一级页表（L0）：根据L0索引，在第一级页表中找到对应的L1页表的基地址。
第二级页表（L1）：根据L1索引，在第二级页表中找到对应的L2页表的基地址。
第三级页表（L2）：根据L2索引，在第三级页表中找到对应的L3页表的基地址。
第四级页表（L3）：根据L3偏移，在第四级页表中找到对应的物理页帧的基地址。
物理地址计算：将找到的物理页帧的基地址与L3偏移相加，得到最终的物理地址。

通过这个过程，ARM64处理器能够将48位的虚拟地址映射到对应的物理地址。这种4级页表的映射机制能够提供灵活的地址空间管理，支持大内存容量和多级映射的需求。

3．在L0～L2页表项描述符中，如何判断一个页表项是块类型还是页表类型？

答：
在L0～L2页表项描述符中，可以通过判断其中的一个特定标志位来确定一个页表项是块类型还是页表类型。这个特定标志位称为"Table"位。

如果"Table"位为0，表示该页表项是块类型。块类型的页表项用于描述一个大的连续物理内存块的映射，例如用于描述1GB或2MB的大页。
如果"Table"位为1，表示该页表项是页表类型。页表类型的页表项用于描述下一级页表的地址，从而实现多级页表的层级结构。

通过检查"Table"位的值，可以确定一个页表项是块类型还是页表类型，进而确定如何解释该页表项的其他字段。这样，ARM64处理器能够根据不同类型的页表项来实现不同层级的地址映射，以满足不同的内存管理需求。

4．在ARM64 Linux内核中，用户空间和内核空间是如何划分的？

答：
在ARM64架构的Linux内核中，用户空间和内核空间是通过虚拟地址空间的划分来实现的。

ARM64架构使用了48位的虚拟地址空间，将整个地址空间划分为两个部分：用户空间和内核空间。

用户空间（User Space）：用户空间是用于执行用户应用程序的区域。它包含了用户进程的代码、数据和堆栈等。用户空间的虚拟地址范围通常是从0x0000000000000000到0x00007FFFFFFFFFFF。
内核空间（Kernel Space）：内核空间是用于运行操作系统内核的区域。它包含了内核的代码、数据结构、设备驱动程序等。内核空间的虚拟地址范围通常是从0xFFFF800000000000到0xFFFFFFFFFFFFFFFF。

用户空间和内核空间之间通过一组页表进行映射和隔离。通过页表的设置，用户空间和内核空间的虚拟地址可以映射到不同的物理地址，实现了对用户空间和内核空间的隔离和保护。

用户空间和内核空间的划分是为了保护内核的安全性和稳定性。用户空间的应用程序只能访问用户空间的资源，而不能直接访问内核空间的资源。通过系统调用和中断等机制，用户空间可以与内核空间进行通信和交互，从而实现对系统资源的访问和管理。

5．在ARM64 Linux内核中，PAGE_OFFSET表示什么意思？

答：
在ARM64 Linux内核中，PAGE_OFFSET是一个宏定义，用于表示内核空间的偏移量。

在ARM64架构中，内核空间的起始地址是固定的，通常是0xFFFF800000000000。而用户空间的起始地址是可变的，取决于具体的进程。

PAGE_OFFSET的值就是内核空间起始地址的低32位部分，即0x00000000FFFFFFFF。通过将PAGE_OFFSET与虚拟地址的高32位相或，可以将虚拟地址转换为对应的物理地址。

在内核中，PAGE_OFFSET常常用于进行虚拟地址和物理地址的转换，以及进行内核空间和用户空间的判断和操作。

6．KIMAGE_VADDR表示什么意思？

答：
KIMAGE_VADDR是一个在ARM64 Linux内核中使用的宏定义，用于表示内核镜像在虚拟地址空间中的起始地址。

在ARM64架构中，内核镜像通常被加载到虚拟地址空间的固定位置。KIMAGE_VADDR的值就是内核镜像在虚拟地址空间中的起始地址，通常是一个固定的地址。

通过使用KIMAGE_VADDR宏定义，可以方便地在内核中引用内核镜像的起始地址，进行一些与内核镜像相关的操作，如符号查找、地址计算等。

7．TEXT_OFFSET表示什么意思？

答：
TEXT_OFFSET是一个在操作系统中使用的术语，用于表示程序代码在内存中的偏移量。

在计算机系统中，程序代码通常存储在内存中的某个特定位置。TEXT_OFFSET就是指代码段在内存中相对于整个进程空间起始地址的偏移量。它表示了代码段相对于进程内存空间起始地址的位置。

通过使用TEXT_OFFSET，可以方便地在程序中引用代码段的地址，进行一些与代码段相关的操作，如跳转、函数调用等。它在程序的执行过程中起到了定位代码的作用。

8．内核映像文件包含哪些段？这些段的作用是什么？在Sysmtem.map文件中它们分别使用哪些符号来表示段的开始和结束？

答：
内核映像文件通常包含以下几个段：

.text段：这是代码段，包含了内核的执行代码。它是内核的核心部分，包括系统调用、中断处理程序、驱动程序等。
.data段：这是数据段，包含了内核的全局变量和静态变量。它存储了内核运行时需要的数据。
.rodata段：这是只读数据段，包含了内核中的只读数据，如字符串常量、只读的全局变量等。
.bss段：这是未初始化数据段，包含了内核中的全局未初始化变量。在内核加载时，这些变量会被初始化为0或空值。

这些段在System.map文件中使用以下符号来表示它们的开始和结束：

_text表示.text段的开始地址。
_etext表示.text段的结束地址。
_data表示.data段的开始地址。
_edata表示.data段的结束地址。
__start_rodata表示.rodata段的开始地址。
__end_rodata表示.rodata段的结束地址。
__bss_start表示.bss段的开始地址。
__bss_stop表示.bss段的结束地址。

System.map文件是一个符号表文件，用于映射内核中的符号（如变量、函数等）与其在内存中的地址之间的关系。通过查看System.map文件，可以了解到这些段在内存中的起始和结束地址，以及其他符号的信息。

9．请画出ARM64 Linux内核的内存布局。

答：

10．__pasymbol()宏和_pa()宏有什么区别？

答：
__pasymbol()宏和_pa()宏在功能上是相似的，都用于获取一个符号（symbol）的物理地址。它们的主要区别在于使用的上下文和调用方式。

__pasymbol()宏是用于内核代码中的，用于获取某个符号的物理地址。它的定义如下：

#define __pasymbol(sym) ((unsigned long)(__pa_symbol(sym)))

其中，__pa_symbol(sym)是一个内部宏，用于获取符号sym的物理地址。

_pa()宏则是用于内核以外的代码中的，用于获取某个内核符号的物理地址。它的定义如下：

#define _pa(x) ((unsigned long)(x) - PAGE_OFFSET)

其中，x是一个内核符号（如变量、函数等），PAGE_OFFSET是一个宏定义，表示内核的偏移地址。

总的来说，__pasymbol()宏和_pa()宏都是用于获取符号的物理地址，但使用的上下文和调用方式有所不同。__pasymbol()宏主要用于内核代码中，而_pa()宏主要用于内核以外的代码中。

11．在物理内存还没有线性映射到内核空间时，内核映像文件映射到什么地方？

答：
在物理内存还没有线性映射到内核空间之前，内核映像文件会被加载到一个临时的虚拟地址空间中。这个虚拟地址空间被称为"临时内核空间"或"早期映射空间"。

在Linux内核启动的早期阶段，内核会将自身的映像文件加载到这个临时内核空间中。这个临时内核空间的大小通常是一个固定的值，例如在x86架构中，通常是从虚拟地址0xC0000000开始的一段连续地址空间。

一旦内核映像文件被加载到临时内核空间中，内核就可以执行自己的代码，并通过临时内核空间中的虚拟地址访问内核的数据结构和函数。随后，在内核初始化的过程中，物理内存会被线性映射到内核空间中，临时内核空间会被废弃，内核映像文件会被重新映射到新的线性地址空间中。

12．在ARM Linux内核中，kimage_voffset代表什么意思呢？

答：
在ARM Linux内核中，kimage_voffset代表内核映像（Kernel Image）的垂直偏移。它是一个变量，用于表示内核映像在物理内存中的偏移量。

在ARM架构中，内核映像在物理内存中的位置是由引导加载程序（Bootloader）决定的。引导加载程序负责将内核映像从存储设备加载到内存中，并告诉内核映像的加载地址。

kimage_voffset的值是在内核启动过程中由引导加载程序传递给内核的。内核使用这个值来计算内核映像在物理内存中的实际地址。通过将加载地址和kimage_voffset相加，内核可以得到内核映像在物理内存中的正确位置。

总结起来，kimage_voffset是ARM Linux内核中用于表示内核映像在物理内存中的垂直偏移的变量。它的值由引导加载程序传递给内核，用于计算内核映像的实际加载地址。

13．在ARMv8架构中，高速缓存管理的PoC和PoU有什么区别？

答：
在ARMv8架构中，高速缓存管理的PoC（Point of Coherency）和PoU（Point of Unification）是两个不同的概念，用于确保数据的一致性和同步。

PoC（Point of Coherency）：PoC是指在数据从处理器核心写入到内存之前，需要确保高速缓存中的数据与内存中的数据保持一致。它主要用于确保处理器核心之间的数据共享的一致性。在使用PoC时，写操作会在到达内存之前刷新高速缓存，以确保其他处理器核心访问相同内存地址时能够获取到最新的数据。
PoU（Point of Unification）：PoU是指在数据从内存加载到处理器核心之前，需要确保高速缓存中的数据与内存中的数据保持一致。它主要用于确保处理器核心与内存之间的数据一致性。在使用PoU时，读操作会在从内存加载数据到处理器核心之前，无效化高速缓存中的数据，以确保从内存加载最新的数据。

总的来说，PoC和PoU都是用于确保数据的一致性和同步的机制。PoC用于处理器核心之间的数据共享的一致性，而PoU用于处理器核心与内存之间的数据一致性。它们在高速缓存管理中起到了不同的作用。

14．在ARMv8架构中，ASID是什么意思？有什么作用？

答：
在ARMv8架构中，ASID（Address Space Identifier）是一种用于标识进程地址空间的机制。每个进程都被分配一个唯一的ASID，用于区分不同的地址空间。

ASID的作用是提高地址转换的效率。在传统的ARM架构中，每次进行地址转换时，需要访问页表以获取正确的映射关系。而在ARMv8架构中，通过使用ASID，可以将最近使用的页表项缓存在TLB（Translation Lookaside Buffer）中，以加快地址转换的速度。当进程切换时，只需要切换ASID，无需刷新整个TLB。

ASID的范围是从0到2^16-1，因此ARMv8架构最多支持2^16 个唯一的地址空间。这使得ARMv8处理器能够高效地支持多任务操作系统，同时保持较低的地址转换开销。

总结来说，ASID在ARMv8架构中用于标识不同的进程地址空间，并提供了一种高效的地址转换机制，以提高系统的性能和效率。

15．在ARMv8架构中支持哪几种内存属性？它们都有哪些特点？

答：
在ARMv8架构中，支持以下几种内存属性：

Normal内存属性：Normal内存属性用于大多数通用内存区域，包括代码、数据和堆栈等。Normal内存属性可以进一步细分为以下几种特点：
- Normal memory non-cacheable（nGnRnE）：这种属性表示内存区域不被缓存，并且不具备乱序执行和早期写入策略。适用于设备寄存器、DMA缓冲区等。
- Normal memory non-cacheable, shareable（nGnRnE）：与上述属性类似，但可共享给其他处理器。
- Normal memory write-back cacheable（nGnRE）：这种属性表示内存区域被缓存，并且支持写回策略。适用于大多数通用内存区域。
- Normal memory write-back cacheable, shareable（nGnRE）：与上述属性类似，但可共享给其他处理器。
Device内存属性：Device内存属性用于设备寄存器、I/O缓冲区等外设相关的内存区域。Device内存属性的特点是不被缓存，并且不进行乱序执行和早期写入策略。
Strongly-ordered内存属性：Strongly-ordered内存属性表示对内存访问的顺序要求非常严格，不进行缓存、乱序执行和早期写入。适用于对内存访问顺序要求非常严格的特殊情况。
Shareable内存属性：Shareable内存属性指示内存区域可与其他处理器共享，并且对缓存一致性有特殊要求。

这些内存属性在ARMv8架构中用于描述内存区域的特性和访问行为，以便处理器和系统在访问内存时能够正确地进行操作和优化。不同的内存属性适用于不同的内存区域和使用场景，确保系统的性能、安全性和一致性。

16．在ARMv8架构中，高速缓存共享属性有内部共享（inner shareable）和外部共享（outer shareable），它们有什么区别？

答：
在ARMv8架构中，高速缓存共享属性有内部共享（inner shareable）和外部共享（outer shareable），它们的区别如下：

内部共享（inner shareable）：内部共享表示高速缓存中的数据可以在同一个处理器核心的不同级别的缓存之间共享。这意味着在同一个处理器核心中，不同级别的缓存（如L1缓存、L2缓存等）可以共享缓存行中的数据。内部共享适用于多级缓存之间的数据共享，可以提高缓存的利用率和性能。
外部共享（outer shareable）：外部共享表示高速缓存中的数据可以在不同处理器核心之间共享。这意味着在多个处理器核心之间，缓存中的数据可以进行共享。外部共享适用于多个处理器核心之间的数据共享，可以实现多核处理器的协同工作和数据一致性。

在ARMv8架构中，可以通过在内存区域的描述符中设置相应的共享属性来指定内部共享或外部共享。这样，处理器和系统可以根据缓存共享属性来进行高速缓存的管理和数据共享，以提高系统性能和一致性。

17．在ARMv8架构中，支持哪几条内存屏障指令？它们都有什么区别？

答：
在ARMv8架构中，支持以下几条内存屏障指令：

DMB（Data Memory Barrier）：该指令用于确保数据操作的顺序性和一致性。它会阻止在屏障之后的数据访问指令重排序，并确保在屏障之前的数据访问指令完成后再执行屏障之后的指令。
DSB（Data Synchronization Barrier）：该指令用于确保数据操作的顺序性和一致性，并且还会等待所有先前的数据访问指令完成。它会阻止在屏障之后的数据访问指令重排序，并等待在屏障之前的数据访问指令完成后再执行屏障之后的指令。
ISB（Instruction Synchronization Barrier）：该指令用于确保指令的顺序性和一致性。它会刷新处理器的指令流水线，并确保在屏障之前的指令执行完成后再执行屏障之后的指令。

这些内存屏障指令的区别如下：

DMB主要用于数据操作的顺序性和一致性，防止数据访问指令重排序，并确保先前的数据访问指令完成后再执行后续指令。
DSB除了具有DMB的功能外，还会等待所有先前的数据访问指令完成，即它会确保在屏障之前的数据访问指令完成后再执行后续指令。
ISB主要用于指令的顺序性和一致性，它会刷新处理器的指令流水线，并确保在屏障之前的指令执行完成后再执行后续指令。

这些内存屏障指令在多核处理器系统中尤为重要，可以确保数据和指令的一致性，并提供正确的同步机制，以避免数据访问和指令执行的异常情况。

18．加载-获取屏障原语与存储-释放屏障原语有什么区别？分别有什么作用？

答：
加载-获取屏障原语（Load-Acquire Barrier）和存储-释放屏障原语（Store-Release Barrier）是内存屏障的两种类型，它们在多线程编程中起着不同的作用。

加载-获取屏障原语（Load-Acquire Barrier）：

作用：加载-获取屏障用于确保在屏障之前的加载操作完成后，后续的读取操作不会读取到过期的数据。
功能：加载-获取屏障会阻止在屏障之后的读取指令重排序，并确保在屏障之前的加载指令完成后再执行后续指令。

存储-释放屏障原语（Store-Release Barrier）：

作用：存储-释放屏障用于确保在屏障之前的存储操作完成后，后续的写入操作对其他线程可见。
功能：存储-释放屏障会阻止在屏障之前的写入指令重排序，并确保在屏障之前的存储指令完成后再执行后续指令。

这两种屏障原语的区别在于它们对读取和写入操作的影响。加载-获取屏障主要关注读取操作，确保读取操作不会读取到过期的数据。而存储-释放屏障主要关注写入操作，确保写入操作对其他线程可见。

在多线程编程中，加载-获取屏障和存储-释放屏障的正确使用可以确保内存操作的顺序性和一致性，避免数据竞争和并发访问的问题。这些屏障原语在同步和通信的场景中非常有用，例如线程间的共享变量同步、锁的获取和释放等。

19．什么是一个段的加载地址和运行地址？

答：
段的加载地址（Load Address）和运行地址（Runtime Address）是与内存中的段（Segment）相关的概念。

在计算机系统中，段是内存分配的基本单位，用于存储程序的指令、数据和堆栈等信息。每个段都有一个加载地址和一个运行地址。

加载地址是指段在物理内存中的起始地址，也称为物理地址。当程序被加载到内存中时，段会被放置在指定的物理内存地址上。

运行地址是指段在程序执行过程中在虚拟内存中的地址，也称为虚拟地址。在程序执行时，操作系统会将物理内存中的段映射到进程的虚拟地址空间中，并为每个进程创建独立的地址空间。

加载地址和运行地址的区别在于它们所描述的地址空间的不同。加载地址是指段在物理内存中的位置，而运行地址是指段在虚拟内存中的位置。

加载地址和运行地址的概念在内存管理和程序执行过程中非常重要。它们的使用可以实现地址空间的隔离和保护，确保程序的正确加载和执行。

20．从U-boot跳转到内核时，为什么指令高速缓存可以打开而数据高速缓存必须关闭？

答：
从U-boot跳转到内核时，指令高速缓存（Instruction Cache）可以打开而数据高速缓存（Data Cache）必须关闭，是因为在这个阶段的执行环境和需求不同。

U-boot是一个引导加载程序，它在系统启动时负责初始化硬件、加载内核镜像等操作。在这个阶段，U-boot需要频繁地读取指令来执行引导过程，因此打开指令高速缓存可以提高指令的访问速度和执行效率。

而数据高速缓存则需要在内核初始化之后才能安全地启用。内核初始化时，会进行一系列复杂的操作，包括内存管理、设备初始化、中断处理等。在这个阶段，数据高速缓存可能会导致缓存一致性的问题，因为内核对内存的读写操作是频繁且复杂的，可能会出现数据不一致的情况。因此，为了保证正确性，U-boot在跳转到内核之前需要关闭数据高速缓存。

一旦内核初始化完成，数据高速缓存就可以安全地启用了。在内核中，数据高速缓存的打开可以提高内存访问的速度和效率，从而提升系统的整体性能。

21．在Linux内核启动汇编代码中，为什么要建立恒等映射？

答：
在Linux内核启动汇编代码中，建立恒等映射的目的是为了确保在启动过程中可以正确访问物理地址空间。

恒等映射是指将物理地址与相同的虚拟地址进行一一映射的过程。在Linux内核启动的早期阶段，尚未建立页表和虚拟内存管理，因此需要通过恒等映射来直接访问物理地址。

建立恒等映射的主要原因有两个：

早期启动：在启动过程中，内核需要进行一些基本的初始化操作，如设置页表、建立内存映射等。为了执行这些操作，需要通过恒等映射来访问物理地址空间。
早期打印：在启动过程中，内核需要输出一些调试信息和错误信息，以便进行故障排除。为了能够将这些信息输出到控制台或串口，需要通过恒等映射来访问物理地址空间中的相关设备。

通过建立恒等映射，内核可以在启动过程中正确地访问物理地址空间，执行必要的初始化和输出操作。一旦建立了页表和虚拟内存管理，就可以使用更高级的内存管理机制来管理和访问内存。

22．在ARMv8架构中，在L0～L2页表项中包含了指向下一级页表的基地址，那么这个下一级页表基地址是物理地址还是虚拟地址？

答：
在ARMv8架构中，L0～L2页表项中包含的下一级页表的基地址是物理地址。这是因为ARMv8架构使用了虚拟地址转换机制，通过页表将虚拟地址映射到物理地址。在这个过程中，每个页表项都包含了下一级页表的物理地址，用于构建页表的层级结构。通过这种方式，ARMv8架构能够实现虚拟地址到物理地址的转换和映射。