kmalloc函数的内幕
kmalloc分配物理内存连续的一块区域,而且不对所获取的空间清零。
#include <linux/slab.h>
void *kmalloc(size_t size, int flags);
标志存放在<linux/gfp.h>中。
GFP_KERNEL:表示它的函数正代表某个进程执行系统调用,此标志是可休眠的,因此函数必须可以重入。
GFP_ATOMIC:用在原子上下文调用中,不会休眠,这是kmalloc甚至会用掉最后一个空闲页面,不过如果连最后一页都没有了,分配就会返回失败。
__GFP_DMA:标志请求分配发生在进行DMA的内存区段中。
内存区段
linux内核把内存分为三个区段:可用于DMA的内存,常规内存以及高端内存。
size参数
内核只能分配一些预定义的,固定大小的字节数组。如果申请任意数量的内存,则可能得到的多一些。
后备高速缓存
适用情况:程序常常会反复的分配很多统一大小的内存块。内核维护了一组拥有统一大小内存块的内存池,通常称为后备高速缓存。
定义在<linux/slab.h>中,创建一个新的高速缓存对象:
keme_caceht *kmem_cache_create( const char *name, size_t size,
size_t offset,
unsigned long flags,
void (*constructor) (void *, kemem_cache_t *, unsigned long flags),
void (*destructor) (void *, kemem_cache_t *, unsigned long flags));
上函数创建一个新的高速缓存对象,其中可以容纳任意数目的内存区域,这些区域的大小有size参数指定。name与这个高速缓存相关联,高速缓存保留指向该名称的指针,因此驱动程序应该将指向静态存储的指针传递给这个函数。
从高速缓存池中分配内存对象:
void *kmem_cache_alloc(kmem_cache_t *cache, int flags);
cache是创建的高速缓存池指针。
释放一个内存对象时使用:
void *kmem_cache_free(kmem_cache_t *cache, const void *obj);
释放所有高速缓存:
int kmem_cache_destroy(kmem_cache_t *cache);
只有已将从缓冲中分配的所有对象都归还后才能成功。所以模块应该检查其返回状态,若失败,则说明存在内存泄露。
内存池
使用情况:内核中有些地方的内存分配是不允许失败的。
内存池对象类型是:mempool_t。定义在<linux/mempool.h>中。
使用mempool_create建立内存池对象:
mempool_t *mempool_create( int min_nr,
mempool_alloc_t *alloc_fn,
mempool_free_t *free_fn,
void *pool_data);
min_nr表示内存池应该始终保持的已分配对象的最少数目。对象的实际分配和释放由alloc_fn以及free_fn函数处理,其原型是:
typedef void *(mempool_alloc_t)(int gfp_mask, void *pool_data);
typedef void (mempool_free_t)(void *element, void *pool_data);
最后一个参数pool_data被传入alloc_fn, free_fn。
通常建立内存池的代码如下:
cache = kmem_cache_create(...); pool = mempool_create( MY_POOL_MINIMUM, mempool_alloc_slab, mempool_free_slab, cache); |
在建立内存池之后,可如下分配和释放对象:
void *mempool_alloc(mempool_t *pool, int gfp_mask);
void mempool_free(void *element, mempool_t *pool);
可以利用下函数调整mempool的大小:
int mempool_resize(mempool_t *pool, int new_min_nr, int gfp_mask);
使用下函数将内存池返回给系统:
void mempool_destroy(mempool_t *pool);
切记:使用mempool会导致大量内存浪费,驱动程序中最好不要使用内存池。
get_free_page和相关函数
get_zeroed_page(unsigned int flags );
返回指向新页面的指针并且将页面清零。
__get_free_page(unsigned int flags);
不清零页面。
__get_free_page(unsigned int flags, unsigned int order);
分配2的order次方物理连续的页面。
基于页的分配策略的优点不在于速度上,而在于更有效的使用了内存,不会浪费内存空间。最大的优点是:可以对这些内存区域进行mmap。
vmalloc以及相关说明详见书本
per-CPU变量
当建立一个per-CPU变量时,系统中的每个处理器都会拥有该变量的特有副本。优点:对per-CPU变量的访问几乎不需要锁定。
创建一个per-CPU变量:
#include <linux/percpu.h>
DEFINE_PER_CPU(type, name);
为避免进程正在访问一个per-CPU变量时被切换到另外一个进程,应该显式的使用宏get_cpu_var得到当前处理器副本,结束后调用put_cpu_var宏。get_cpu_var得到的是当前处理器变量版本的左值,可以直接赋值或者操作。如
get_cpu_var(sockets_in_use)++;
put_cpu_var(sockets_in_use);
可以使用下面的宏访问其他处理器的变量副本:
per_cpu(variable, int cpu_id);
动态分配per_CPU变量:
void *alloc_percpu(type);
void *__alloc_percpu(size_t size, size_t align);
动态分配的per_CPU变量通过free_percpu将其返回给系统。
对动态分配的per_CPU变量的访问通过per_cpu_ptr完成:
per_cpu_ptr(void *per_cpu_var, int cpu_id);
为保护动态分配per_CPU变量的引用时不被抢占,需要使用get_cpu宏来阻止抢占。对动态per_CPU变量的引用代码常见如下:
int cpu;
cpu = get_cpu();
ptr = per_cpu_ptr(per_cpu_var, cpu);
put_cpu();
per_CPU变量可以导出给模块,使用下面的宏:
EXPORT_PER_CPU_SYMBOL(per_cpu_var);
EXPORT_PER_CPU_SYMBOL_GPL(per_cpu_var);
在其他模块使用时,应该声明如下:
DECLARE_PER_CPU(type, name);
<linux/percpu_counter.h>中可以使用per_CPU变量来建立简单的整数计数器。
在系统引导时获得专用缓冲区
这是获得大量内存页并且一般不会失败的方法。详见书。