第八章:分配内存

kmalloc函数的内幕

kmalloc分配物理内存连续的一块区域,而且不对所获取的空间清零。

#include <linux/slab.h>

void *kmalloc(size_t size, int flags);

标志存放在<linux/gfp.h>中。

GFP_KERNEL:表示它的函数正代表某个进程执行系统调用,此标志是可休眠的,因此函数必须可以重入。

GFP_ATOMIC:用在原子上下文调用中,不会休眠,这是kmalloc甚至会用掉最后一个空闲页面,不过如果连最后一页都没有了,分配就会返回失败。

__GFP_DMA:标志请求分配发生在进行DMA的内存区段中。

内存区段

linux内核把内存分为三个区段:可用于DMA的内存,常规内存以及高端内存。

size参数

内核只能分配一些预定义的,固定大小的字节数组。如果申请任意数量的内存,则可能得到的多一些。

后备高速缓存

适用情况:程序常常会反复的分配很多统一大小的内存块。内核维护了一组拥有统一大小内存块的内存池,通常称为后备高速缓存。

定义在<linux/slab.h>中,创建一个新的高速缓存对象:

keme_caceht *kmem_cache_create( const char *name, size_t size,

size_t offset,

unsigned long flags,

void (*constructor) (void *, kemem_cache_t *, unsigned long flags),

void  (*destructor)  (void *, kemem_cache_t *, unsigned long flags));

上函数创建一个新的高速缓存对象,其中可以容纳任意数目的内存区域,这些区域的大小有size参数指定。name与这个高速缓存相关联,高速缓存保留指向该名称的指针,因此驱动程序应该将指向静态存储的指针传递给这个函数。

从高速缓存池中分配内存对象:

void *kmem_cache_alloc(kmem_cache_t *cache, int flags);

cache是创建的高速缓存池指针。

释放一个内存对象时使用:

void *kmem_cache_free(kmem_cache_t *cache, const void *obj);

释放所有高速缓存:

int kmem_cache_destroy(kmem_cache_t *cache);

只有已将从缓冲中分配的所有对象都归还后才能成功。所以模块应该检查其返回状态,若失败,则说明存在内存泄露。

内存池

使用情况:内核中有些地方的内存分配是不允许失败的。

内存池对象类型是:mempool_t。定义在<linux/mempool.h>中。

使用mempool_create建立内存池对象:

mempool_t *mempool_create( int min_nr,

mempool_alloc_t *alloc_fn,

mempool_free_t *free_fn,

void *pool_data);

min_nr表示内存池应该始终保持的已分配对象的最少数目。对象的实际分配和释放由alloc_fn以及free_fn函数处理,其原型是:

typedef void *(mempool_alloc_t)(int gfp_mask, void *pool_data);

typedef void (mempool_free_t)(void *element, void *pool_data);

最后一个参数pool_data被传入alloc_fn, free_fn

通常建立内存池的代码如下:

cache = kmem_cache_create(...);

pool = mempool_create(  MY_POOL_MINIMUM,

 mempool_alloc_slab, mempool_free_slab,

 cache);

在建立内存池之后,可如下分配和释放对象:

void *mempool_alloc(mempool_t *pool, int gfp_mask);

void mempool_free(void *element, mempool_t *pool);

可以利用下函数调整mempool的大小:

int mempool_resize(mempool_t *pool, int new_min_nr, int gfp_mask);

使用下函数将内存池返回给系统:
void mempool_destroy(mempool_t *pool);

切记:使用mempool会导致大量内存浪费,驱动程序中最好不要使用内存池。

get_free_page和相关函数

get_zeroed_page(unsigned int flags );

返回指向新页面的指针并且将页面清零。

__get_free_page(unsigned int flags);

不清零页面。

__get_free_page(unsigned int flags, unsigned int order);

分配2order次方物理连续的页面。

基于页的分配策略的优点不在于速度上,而在于更有效的使用了内存,不会浪费内存空间。最大的优点是:可以对这些内存区域进行mmap

vmalloc以及相关说明详见书本

per-CPU变量

当建立一个per-CPU变量时,系统中的每个处理器都会拥有该变量的特有副本。优点:对per-CPU变量的访问几乎不需要锁定。

创建一个per-CPU变量:

#include <linux/percpu.h>

DEFINE_PER_CPU(type, name);

为避免进程正在访问一个per-CPU变量时被切换到另外一个进程,应该显式的使用宏get_cpu_var得到当前处理器副本,结束后调用put_cpu_var宏。get_cpu_var得到的是当前处理器变量版本的左值,可以直接赋值或者操作。如

get_cpu_var(sockets_in_use)++;

put_cpu_var(sockets_in_use);

可以使用下面的宏访问其他处理器的变量副本:

per_cpu(variable, int cpu_id);

动态分配per_CPU变量:

void *alloc_percpu(type);

void *__alloc_percpu(size_t size, size_t align);

动态分配的per_CPU变量通过free_percpu将其返回给系统。

对动态分配的per_CPU变量的访问通过per_cpu_ptr完成:

per_cpu_ptr(void *per_cpu_var, int cpu_id);

为保护动态分配per_CPU变量的引用时不被抢占,需要使用get_cpu宏来阻止抢占。对动态per_CPU变量的引用代码常见如下:

int cpu;

cpu = get_cpu();

ptr = per_cpu_ptr(per_cpu_var, cpu);

put_cpu();

per_CPU变量可以导出给模块,使用下面的宏:

EXPORT_PER_CPU_SYMBOL(per_cpu_var);

EXPORT_PER_CPU_SYMBOL_GPL(per_cpu_var);

在其他模块使用时,应该声明如下:

DECLARE_PER_CPU(type, name);

<linux/percpu_counter.h>中可以使用per_CPU变量来建立简单的整数计数器。

在系统引导时获得专用缓冲区

这是获得大量内存页并且一般不会失败的方法。详见书。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值