一、kmalloc函数内幕
kmalloc的使用已经比较熟悉了,它的函数原型是:
1: #include <linux/slab.h>
2: void *kmalloc(size_t size, int flags);
其中size表示要分配的块的大小, flags是分配标志。下面分别详细说明这两个参数:
* size参数
实际上内核能分配的最小内存大小不是任意的,而是一些预定义的、固定大小的字节数组。linux创建一系列的内存对象池,每个池中的内存块大小事固定一致的。所以实际上申请到的内存大小可能会比size多一些,最多的时候会是2*size大小。另外,kmalloc能处理的最小内存块是32或64,取决于体系结构使用的页面大小。kmalloc不应该分配大于128KB的内存。
* flags参数
最常用的标志是GFP_KERNEL, GFP_ATOMIC。其次是__GFP_DMA和__GFP_HIGHMEM。其中GFP的意思就是get free page。GFP_KERNEL和GFP_ATOMIC的区别在于前者使用在进程上下文中,后者使用在进程上下文之外,例如中断上下文。所以前者可能在没有空闲内存时使进程休眠,而后者是不能休眠的。
二、后备高速缓存(lookaside cache)
linux高速缓存管理通过slab分配器来实现,通过slab实现的高速缓存具有kmem_cache_t类型。创建的函数如下,这个函数在2.6.32内核中和书中是不一样的,这里以2.6.32为准进行分析:
1: #include <linux/slab.h>
2: struct kmem_cache *kmem_cache_create (const char *name, size_t size, size_t align, unsigned long flags, void (*ctor)(void *))
函数中各参数意义如下:
* name: 使用在/proc/slabinfo中用来识别这个高速缓存的字符串。 在/proc目录下使用cat slabinfo可以查看现有的高速缓存。
* size: 在高速缓存中的每个内存对象的大小
* align: 确保已分配的对象进行某种特殊的对齐
* flags: 分配标志位。主要有以下位掩码(其中标志为DEBUG的只有在CONFIG_SLAB_DEBUG被设置才可用):
1: #define SLAB_DEBUG_FREE 0x00000100UL /* DEBUG: Perform (expensive) checks on free */
2: #define SLAB_RED_ZONE 0x00000400UL /* DEBUG: Red zone objs in a cache */
3: #define SLAB_POISON 0x00000800UL /* DEBUG: Poison objects */
4: #define SLAB_HWCACHE_ALIGN 0x00002000UL /* Align objs on cache lines */
5: #define SLAB_CACHE_DMA 0x00004000UL /* Use GFP_DMA memory */
6: #define SLAB_STORE_USER 0x00010000UL /* DEBUG: Store the last owner for bug hunting */
7: #define SLAB_PANIC 0x00040000UL /* Panic if kmem_cache_creat() fails*/
* ctor是内存对象的构造函数
高速缓存被创建完了以后,可以调用kmem_cache_alloc函数从中分配内存,释放一个内存对象则要调用kmem_cache_free函数。而释放一个高速缓存则要调用kmem_cache_destroy函数。注意这里高速缓存和内存对象的区别。另外还要注意的是:如果高速缓存中分配的内存对象还没有全部释放的情况下,此时释放高速缓存会失败,也就是会导致内存泄漏。所以设备驱动程序必须检查kmem_cache_destroy的返回状态。
三、get_free_page和相关函数
当需要分配大块内存时,不应该使用kmalloc,而应该使用get_free_page进行整页分配。相关函数如下:
1: get_zeroed_page(unsigned int flags); //分配一个页面,返回指向页面的指针,并将该页清零
2: __get_free_page(unsigned int flags); //分配一个页面,返回指向页面的指针,但不清零
3: __get_free_pages(unsigned int flags, unsigned int order); /*分配连续的页面,返回指向该内存区域的第一个字节的指针,不清零*/
释放内存页面的函数如下:
1: void free_page(unsigned long addr);
2: void free_pages(unsigned long addr, unsigned long order);
四、vmalloc及其辅助函数
vmalloc用来分配虚拟地址空间的连续区域,尽管物理上可能不连续,但是内核认为它们在地址上是连续的。相关函数如下:
1: #include <linux/vmalloc.h>
2: void *vmalloc(unsigned long size);
3: void vfree(void *addr);
4: void *ioremap(unsigned long offset, unsigned long size);
5: void iounmap(void *addr);
五、per-CPU变量,以下内容摘自http://blogold.chinaunix.net/u/12325/showart.php?id=1274548
1. 简介
2.6内核的特性,每个处理器都拥有自己的变量副本。
2. 优势
每个处理器访问自己的副本,无需加锁,可以放入自己的cache中,极大地提高了访问与更新效率。常用于计数器。
3. 使用
相关头文件:<linux/percpu.h>
(1) 编译期间分配
声明:
DEFINE_PER_CPU(type, name);
避免进程在访问一个per-CPU变量时被切换到另外一个处理器上运行或被其它进程抢占:
get_cpu_var(变量)++;
put_cpu_var(变量);
访问其他处理器的变量副本用这个宏:
per_cpu(变量,int cpu_id);
(2) 动态分配与释放
动态分配per-CPU变量:
void * alloc_percpu(type);
void * __alloc_percpu(size_t size, size_t align); //可以做特定的内存对齐
释放动态分配的per-CPU变量:
free_percpu();
访问动态分配的per-CPU变量的访问通过per_cpu_ptr完成:
per_cpu_ptr(void * per_cpu_var, int cpu_id);
要想阻塞抢占,使用get_cpu()与put_cpu()即可:
int cpu = get_cpu();
ptr = per_cpu_ptr(per_cpu_var, cpu);
put_cpu();
(3) 导出Per-CPU变量给模块
EXPORT_PER_CPU_SYMBOL(per_cpu_var);
EXPORT_PER_CPU_SYMBOL_GPL(per_cpu_var);
要在模块中访问这样一个变量,应该这样做声明:
DECLARE_PER_CPU(type, name);
4. 注意
在某些体系结构上,per-CPU变量可使用的地址空间是受限的,要尽量保持这些变量比较小。
5. Per-CPU变量的实现
每个CPU都有对应的专有的数据区,在start_kernel()中调用setup_per_cpu_areas()进行分配和初始化。通过数据区的首地址与偏移量信息访问Per-CPU变量。