Linux的内存管理设计(这里指堆分配的伙伴算法)看似很聪明,但在我看来是考虑不周。它是以页为最小单位分配,但分配的页可能不连续,所以对4K以上的连续空间操作一定要谨慎,因为分配的内存对用户可见的逻辑地址是连续的,而对用户不可见的物理地址是不连续的。对于写驱动程序的人,了解这一点很重要,因为有时外设不会管这些事情,外设主动取数据都认为地址连续,如果你单纯地用kmalloc开辟共享空间,很可能导致难以发现的错误。当你需要一片很大的连续的物理内存空间时,有两种方案:
1,在bootloader中设定可用内存时,预留出一片内存,即少给Linux留点。在写驱动程序的时候,用ioremap重新映射这片空间(物理地址须自知),假装这片地址属于你的设备。这个方法不太通用,因为这和内存的起始地址有关,换个系统就不行了。所以不推荐。
2,用CAM技术。CMA即continuous memory access,即连续内存访问。这是Linux为了弥补之前内存管理欠考虑之处而新加的技术(其实已经不新了,但很多书仍然不提)。它的思想也是提前预留一片区域,但不是指望修改bootloader,而是直接修改内核,这样Linux是知道这件事的,留给Linux的内存同样会减少,但至少不和内存的起始地址有关了。
分配CMA的方法如下:
配置内核:https://blog.csdn.net/zhaoxinfan/article/details/83245682
勾选 Memory Management options->Contiguous Memory Allocator //找不到用"/"查找
勾选 Device drivers->general driver options->DMA Contiguous
Max count of the CMA area 我改成了10
Size in Mega Bytes 写512
最大PAGE_SIZE 是指页对齐尺寸 = 页大小(4K)*2^(PAGE_SIZE), 如写8,就是4k*2^8=1M
dmesg | grep cma 查看是否成功
除了使用CMA外,还需要用到DMA的内存分配方法,才能保证这片内存可以透明地(没有cache导致的内存不一致地)被访问。
比如可以用dma_alloc_coherent(dev, total_size, &bus_addr, GFP_KERNEL); 其用法可以参考https://blog.csdn.net/zhijianjingling00/article/details/9315109。
这还不算完,如果你用read、write函数访问这片内存是够了,但如果你想将这片区域映射给用户,即用mmap(),那你还得注意一点(本人就被这点坑过)。
驱动中的mmap函数应该这样实现:
static int amr_mmap(struct file *filp, struct vm_area_struct *vma)
{
struct amr_local *lp = filp->private_data;
// vma->vm_page_prot = pgprot_noncached(vma->vm_page_prot);//这样会产生bus error的报错,需要用下面的函数
vma->vm_page_prot = pgprot_writecombine(vma->vm_page_prot); //这可以防止memset时产生bus error的报错,据说是memset不能用于device
if(remap_pfn_range(vma, vma->vm_start, virt_to_phys(lp->fb) >> PAGE_SHIFT, \
vma->vm_end - vma->vm_start, vma->vm_page_prot))
return -EAGAIN;
return 0;
}
有以上三步,你便可以安心使用连续内存了。