linux内存分配器类型,内核早期内存分配器：memblock

最新推荐文章于 2024-06-12 11:38:53 发布

盈超农化

最新推荐文章于 2024-06-12 11:38:53 发布

阅读量764

点赞数

文章标签： linux内存分配器类型

本文介绍了Linux内核启动阶段的内存管理器memblock的工作原理，包括关键数据结构、基本操作及系统内存的探测与记录。此外，还探讨了连续内存分配器(CMA)的初始化过程及其在预留内存管理中的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

原标题：内核早期内存分配器：memblock

本文转载自Linux爱好者

本文来自程雪涛的自荐投稿

Linux内核使用伙伴系统管理内存，那么在伙伴系统工作前，如何管理内存？答案是memblock。

memblock在系统启动阶段进行简单的内存管理，记录物理内存的使用情况。

在进一步介绍memblock之前，有必要先了解下系统内存的使用情况：

首先，内存中的某些部分是永久的分配给内核的，比如内核代码段和数据段，ramdisk和fdt占用的空间等，它们是系统内存的一部分，但是不能被侵占，也不参与内存分配，称之为静态内存；

其次，GPU，Camera等都需要预留大量连续内存，这部分内存平时不用，但是系统必须提前预留好，称之为预留内存；

最后，内存的其余部分称之为动态内存，是需要内核管理的宝贵资源。

memblock把物理内存划分为若干内存区，按使用类型分别放在memory和reserved两个集合(数组)中，memory即动态内存的集合，reserved集合包括静态内存和预留内存。

1. memblock关键数据结构

memblock数据结构定义如下：

memblock相关数据结构十分的简单，内核还为memblock定义了一个全局变量，并为其赋初值，如下：

memory类型的内存集合指向memblock_memory_init_regions数组，最多可以记录128个内存区。

reserved类型的内存集合指向memblock_reserved_init_regions数组，最多可以记录128个内存区。

注：内核代码经常用到类似”__initdata_memblock”的宏定义，通常用来指定变量或函数所在的section，该宏的定义如下：

#define __meminitdata __attribute__ ((__section__(".meminit.data")))

2. memblock基本操作1) 添加内存区

分别为memory和reserved集合添加内存区，如果新加入的内存区与原有内存区重叠，则合并到原有内存区，否则插入新内存区。

实际工作由memblock_add_range()完成，type参数指定内存集合类型。

需要注意的是该函数内部会执行两次：

第一次计算需要插入几个内存区，如果超过允许的最大内存区个数，则double内存区数组；

第二次执行内存区的实际插入与合并操作。

2) 移除内存区

intmemblock_remove(phys_addr_tbase,phys_addr_tsize);

从memory集合移除给定物理地址所指的内存区，如果是内存区域的一部分，则涉及到调整region大小，或者将一个region拆分成两个region。

系统将不会为移除的内存区建立内存映射，这部分内存区后续应该由DMA或CMA管理。

3) 分配内存

phys_addr_t memblock_alloc(phys_addr_tsize,phys_addr_talign);

phys_addr_t memblock_alloc_range(phys_addr_tsize,phys_addr_talign,phys_addr_tstart,phys_addr_tend);

使用该函数向kernel申请一块可用的物理内存，memblock使用自顶向下(取决于bottom_up的值)的方式查找空闲内存，实际操作是在memory region中查找合适的内存，并加入到reserved region中以标记这块内存已经被使用。

4) 释放内存

intmemblock_free(phys_addr_tbase,phys_addr_tsize);

使用该函数来释放由memblock_alloc申请到的物理内存。

3. 探测系统可用内存

内核是如何知晓物理内存的拓扑结构呢？相信很多人都有过类似的疑问。

通过DDR的模式寄存器(MR8)，可以很容易获得内存密度，进而推断出内存容量，这部分工作通常由bootloader完成，然后使用fdt或者atag等方式传递给内核。

以fdt为例，内核解析memory节点，取得物理内存的拓扑结构(起始地址及大小)，并添加到memblock中，代码如下：

setup_arch()->setup_machine_fdt()->early_init_dt_scan()->early_init_dt_scan_memory()

{

......

reg=of_get_flat_dt_prop(node,"reg",&l);

......

while((endp-reg)>=(dt_root_addr_cells+dt_root_size_cells)){

u64base,size;

base=dt_mem_next_cell(dt_root_addr_cells,&reg);

size=dt_mem_next_cell(dt_root_size_cells,&reg);

......

early_init_dt_add_memory_arch(base,size);

}

}

该函数扫描memory节点，并解析reg属性，注意此时DeviceTree还没有执行unflattern操作，需要使用”fdt”类型接口解析dtb。

以4G DDR为例，输出的调试信息如下：

[0.000000]memory scan nodememory,regsize32,data:080080,100000000557e

[0.000000]-80000000,80000000

[0.000000]-100000000,7e550000

reg属性由addr和size组成，分别占用2个cell(u32类型数据)，上面的reg data可以看成：“0 00000080 0 00000080, 01000000 0 0 00557e”。

dtb使用big endian方式存储数据，需要转换成cpu字节序。

解析出来的内存包含两个Rank，起始地址分别是0x80000000和0x100000000，这是系统的可用内存，用来初始化memory region。

voidearly_init_dt_add_memory_arch(base,size)

{

constu64phys_offset=__pa(PAGE_OFFSET);

......

if(base

pr_warning("Ignoring memory range 0x%llx - 0x%llxn",

base,phys_offset);

size-=phys_offset-base;

base=phys_offset;

}

memblock_add(base,size);

}

从fdt解析的内存信息是否可信呢？内核有自己的判断，在启动阶段，内核会根据自身的运行地址计算内存基地址，即PHYS_OFFSET。

如果base地址小于phys_offset，则内核使用可信的phys_offset做为主存的基地址。

这里要注意区分PHYS_OFFSET, PAGE_OFFSET：

PAGE_OFFSET是内核虚拟地址空间的起始地址，PHYS_OFFSET是RAM在物理空间的起始地址，内核空间的地址映射通常具有固定的偏移量，即：

#define __virt_to_phys(x) (((phys_addr_t)(x) - PAGE_OFFSET + PHYS_OFFSET))

4. 记录系统预留内存

这里说的系统预留内存，包括静态内存(内核Image，ramdisk，fdt等占用空间)，以及系统为Camera，Display等子系统预留的大量连续内存。

另外，高通平台通常包含多核，还需要为Modem，TZ/TA等预留运行空间，这部分空间类似静态内存，都是永久分配给其它核心使用，根据节点属性，通常由DMA管理。

arm64_memblock_init()函数初始化系统预留内存，代码如下：

“no-map”属性决定向reserved region添加内存区，还是从memory region移除内存区，二者差别在于内核不会给”no-map”属性的内存区建立内存映射，即该内存区不在动态内存管理范围。

预留内存还会被添加到reserved_mem数组，为后续的初始化做准备，”reg”属性指定内存区的起始地址和大小，如果没有”reg”属性，还需要为内存区分配空间。

至此，memblock的初始化工作已经基本完成了，主要是记录系统内存的使用情况：

memory region记录系统了所有可用的动态内存；

reserved region记录了系统预留内存，这部分内存通常由CMA管理，也属于动态内存范畴；

reserved_mem数组则记录系统所有预留内存，包括”no-map”属性的内存区，为后续进一步初始化工作做准备。

5. 初始化预留内存区

内存向来是系统的宝贵资源，预留内存如果仅做为子系统的专用内存，就有点浪费了。

Linux内核引入CMA(Contiguous Memory Allocator，连续内存分配器)。

其工作原理是：为驱动预留一段内存，当驱动不用时，Memory Allocator(Buddy System)可以分配给用户进程使用；而当驱动需要使用时，就将进程占用的内存通过回收或者迁移的方式腾出来，供驱动使用。

但是并不是所有的预留内存都由CMA管理，像Modem，TA等永久分配给其它核心使用的内存空间，内核并不为这部分空间建立内存映射，而是交由DMA管理。

通过上面的分析，我们看到所有预留内存信息都记录在reserved_mem数组，下面先看看该结构体的定义：

“reg”和”no-map”属性前面介绍过，详细可以参考reserved-memory.txt，”compatible”属性使用标准定义，内核注册两种不同的处理方法：

RESERVEDMEM_OF_DECLARE(dma,"removed-dma-pool",removed_dma_setup);

RESERVEDMEM_OF_DECLARE(cma,"shared-dma-pool",rmem_cma_setup);

“removed-dma-pool”表示该内存区位于DMA管理区，内核不可见(没有页表)。

“shared-dma-pool”表示该内存区位于CMA管理区，平时是可用的，只有需要时才分配给驱动使用。

如果没有”reg”属性，即没有指定预留内存的起始地址，则需要由系统分配预留内存，然后初始化reserved_mem的ops成员：

此处为”shared-dma-pool”类型的内存注册操作方法，cma_init_reserved_mem初始化cma_area(CMA管理区)。

reserved_mem的ops成员包括init和release两个操作方法：

structreserved_mem_ops{

int(*device_init)(structreserved_mem *rmem,structdevice *dev);

void(*device_release)(structreserved_mem *rmem,structdevice *dev);

};

驱动注册预留内存区时调用device_init方法，为设备指定预留内存操作方法(DMA)或预留内存区域(CMA)，这些方法包括预留内存的申请，释放和mmap等。

6. 连续内存分配器(CMA)

CMA的初始化必须在buddy系统工作之前和memblock分配器初始化完成之后。

在ARM中，初始化CMA的接口是：

以命令行参数”cma=32M@0-0xfffffff”为例: size_cmdline = 32M, base_cmdline = 0x0, limit_cmdline = 0xffffffff 。

计算好CMA的size等值以后就进入cma_declare_contiguous中：

以上只是将CMA区域预留下来，并记录到相关数组，进一步初始化和使用需要等slab等子系统初始化完成后了。

CMA并不直接开放给驱动开发人员，在注册设备时可以使用”memory-region”属性指定要操作的内存区域，需要分配DMA内存时，调用DMA相关函数就可以了。

例如dma_alloc_coherent()，最终DMA相关的分配函数会到达CMA的分配函数dma_alloc_from_contiguous()。

7. 进阶阅读

memblock和bootmem的区别

CMA(连续内存分配器)

Contiguous Memory Allocator (CMA) 源码分析

Linux内核最新连续内存分配器(CMA) — 避免预留大块内存

内存管理笔记(CMA)返回搜狐，查看更多

责任编辑：

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。