kzalloc 函数详解

用kzalloc申请内存的时候, 效果等同于先是用 kmalloc() 申请空间 , 然后用 memset() 来初始化 ,所有申请的元素都被初始化为 0.

  1. /** 
  2.  * kzalloc - allocate memory. The memory is set to zero. 
  3.  * @size: how many bytes of memory are required. 
  4.  * @flags: the type of memory to allocate (see kmalloc). 
  5.  */  
  6. static inline void *kzalloc(size_t size, gfp_t flags)  
  7. {  
  8.     return kmalloc(size, flags | __GFP_ZERO);  
  9. }  
kzalloc 函数是带参数调用kmalloc函数,添加的参数是或了标志位__GFP_ZERO,
  1. void *__kmalloc(size_t size, gfp_t flags)  
  2. {  
  3.     struct kmem_cache *s;  
  4.     void *ret;  
  5.   
  6.     if (unlikely(size > SLUB_MAX_SIZE))  
  7.         return kmalloc_large(size, flags);  
  8.   
  9.     s = get_slab(size, flags);  
  10.   
  11.     if (unlikely(ZERO_OR_NULL_PTR(s)))  
  12.         return s;  
  13.   
  14.     ret = slab_alloc(s, flags, -1, _RET_IP_);  
  15.   
  16.     trace_kmalloc(_RET_IP_, ret, size, s->size, flags);  
  17.   
  18.     return ret;  
  19. }  
这个函数调用trace_kmalloc,flags参数不变,继续往里面可以看到

  1. static __always_inline void *slab_alloc(struct kmem_cache *s,  
  2.         gfp_t gfpflags, int node, unsigned long addr)  
  3. {  
  4.     void **object;  
  5.     struct kmem_cache_cpu *c;  
  6.     unsigned long flags;  
  7.     unsigned int objsize;  
  8.   
  9.     gfpflags &= gfp_allowed_mask;  
  10.   
  11.     lockdep_trace_alloc(gfpflags);  
  12.     might_sleep_if(gfpflags & __GFP_WAIT);  
  13.   
  14.     if (should_failslab(s->objsize, gfpflags))  
  15.         return NULL;  
  16.   
  17.     local_irq_save(flags);  
  18.     c = get_cpu_slab(s, smp_processor_id());  
  19.     objsize = c->objsize;  
  20.     if (unlikely(!c->freelist || !node_match(c, node)))  
  21.   
  22.         object = __slab_alloc(s, gfpflags, node, addr, c);  
  23.   
  24.     else {  
  25.         object = c->freelist;  
  26.         c->freelist = object[c->offset];  
  27.         stat(c, ALLOC_FASTPATH);  
  28.     }  
  29.     local_irq_restore(flags);  
  30.   
  31.     if (unlikely((gfpflags & __GFP_ZERO) && object))  
  32.         memset(object, 0, objsize);  
  33.   
  34.     kmemcheck_slab_alloc(s, gfpflags, object, c->objsize);  
  35.     kmemleak_alloc_recursive(object, objsize, 1, s->flags, gfpflags);  
  36.   
  37.     return object;  
  38. }  
这里主要判断两个标志,WAIT和ZERO,和本文有关的关键代码就是

if (unlikely((gfpflags & __GFP_ZERO) && object))
memset(object, 0, objsize);


到此,这个函数区别于kmalloc的地方就清楚了

kmalloc 函数详解

#include <linux/slab.h> void *kmalloc(size_t size, int flags);

给 kmalloc 的第一个参数是要分配的块的大小. 第 2 个参数, 分配标志, 非常有趣, 因为它以几个方式控制 kmalloc 的行为.

最一般使用的标志, GFP_KERNEL, 意思是这个分配((内部最终通过调用 __get_free_pages 来进行, 它是 GFP_ 前缀的来源) 代表运行在内核空间的进程而进行的. 换句话说, 这意味着调用函数是代表一个进程在执行一个系统调用. 使用 GFP_KENRL 意味着 kmalloc 能够使当前进程在少内存的情况下睡眠来等待一页. 一个使用 GFP_KERNEL 来分配内存的函数必须, 因此, 是可重入的并且不能在原子上下文中运行. 当当前进程睡眠, 内核采取正确的动作来定位一些空闲内存, 或者通过刷新缓存到磁盘或者交换出去一个用户进程的内存.

GFP_KERNEL 不一直是使用的正确分配标志; 有时 kmalloc 从一个进程的上下文的外部调用. 例如, 这类的调用可能发生在中断处理, tasklet, 和内核定时器中. 在这个情况下, 当前进程不应当被置为睡眠, 并且驱动应当使用一个 GFP_ATOMIC 标志来代替. 内核正常地试图保持一些空闲页以便来满足原子的分配. 当使用 GFP_ATOMIC 时, kmalloc 能够使用甚至最后一个空闲页. 如果这最后一个空闲页不存在, 但是, 分配失败.

其他用来代替或者增添 GFP_KERNEL 和 GFP_ATOMIC 的标志, 尽管它们 2 个涵盖大部分设备驱动的需要. 所有的标志定义在 <linux/gfp.h>, 并且每个标志用一个双下划线做前缀, 例如 __GFP_DMA. 另外, 有符号代表常常使用的标志组合; 这些缺乏前缀并且有时被称为分配优先级. 后者包括:

GFP_ATOMIC
用来从中断处理和进程上下文之外的其他代码中分配内存. 从不睡眠.

GFP_KERNEL
内核内存的正常分配. 可能睡眠.

GFP_USER
用来为用户空间页来分配内存; 它可能睡眠.

GFP_HIGHUSER
如同 GFP_USER, 但是从高端内存分配, 如果有. 高端内存在下一个子节描述.

GFP_NOIO
GFP_NOFS
这个标志功能如同 GFP_KERNEL, 但是它们增加限制到内核能做的来满足请求. 一个 GFP_NOFS 分配不允许进行任何文件系统调用, 而 GFP_NOIO 根本不允许任何 I/O 初始化. 它们主要地用在文件系统和虚拟内存代码, 那里允许一个分配睡眠, 但是递归的文件系统调用会是一个坏注意.

上面列出的这些分配标志可以是下列标志的相或来作为参数, 这些标志改变这些分配如何进行:

__GFP_DMA
这个标志要求分配在能够 DMA 的内存区. 确切的含义是平台依赖的并且在下面章节来解释.

__GFP_HIGHMEM
这个标志指示分配的内存可以位于高端内存.

__GFP_COLD
正常地, 内存分配器尽力返回"缓冲热"的页 -- 可能在处理器缓冲中找到的页. 相反, 这个标志请求一个"冷"页, 它在一段时间没被使用. 它对分配页作 DMA 读是有用的, 此时在处理器缓冲中出现是无用的.

__GFP_NOWARN
这个很少用到的标志阻止内核来发出警告(使用 printk ), 当一个分配无法满足.

__GFP_HIGH
这个标志标识了一个高优先级请求, 它被允许来消耗甚至被内核保留给紧急状况的最后的内存页.

__GFP_REPEAT
__GFP_NOFAIL
__GFP_NORETRY
这些标志修改分配器如何动作, 当它有困难满足一个分配. __GFP_REPEAT 意思是" 更尽力些尝试" 通过重复尝试 -- 但是分配可能仍然失败. __GFP_NOFAIL 标志告诉分配器不要失败; 它尽最大努力来满足要求. 使用 __GFP_NOFAIL 是强烈不推荐的; 可能从不会有有效的理由在一个设备驱动中使用它. 最后, __GFP_NORETRY 告知分配器立即放弃如果得不到请求的内存.

kmalloc 能够分配的内存块的大小有一个上限. 这个限制随着体系和内核配置选项而变化. 如果你的代码是要完全可移植, 它不能指望可以分配任何大于 128 KB. 如果你需要多于几个 KB

这方面的原因:
kmalloc并不直接从分页机制中获得空闲页面而是从slab页面分配器那儿获得需要的页面,slab的实现代码限制了最大分配的大小为128k,即131072bytes,理论上你可以通过更改slab.c中的 cache_sizes数组中的最大值使得kmalloc可以获得更大的页面数,不知道有没有甚么副效应或者没有必要这样做,因为获取较大内存的方法有很多,想必128k是经验总结后的合适值。

alloc_page( )可以分配的最大连续页面是4K
 static inline struct page * alloc_pages(unsigned int gfp_mask, unsigned int order) 

/* 
 * Gets optimized away by the compiler. 
 */ 
 if (order >= MAX_ORDER) 
 return NULL; 
 return _alloc_pages(gfp_mask, order); 
 } 

alloc_pages最大分配页面数为512个,则可用内存数最大为2^9*4K=2M
  
<think>嗯,用户之前问过探测函数(Probe Function)的作用,现在又问“端口添加 详解”,看来他们可能在开发Linux内核驱动,特别是涉及到多端口设备的情况,比如串口或网络设备。用户可能正在尝试在驱动中添加多个端口,或者在调试时遇到了问题,需要了解如何正确实现端口添加的流程。 首先,我需要确定“端口添加”在驱动开发中的具体含义。通常,这可能涉及到在设备驱动中注册多个端口,例如串口控制器支持多个UART端口,或者网络设备有多个网络接口。这时候,驱动需要在探测函数中遍历每个端口,分配资源,并逐个注册到相应的子系统中。 用户可能遇到的问题包括资源分配失败、端口注册顺序错误,或者如何处理动态添加和移除端口。此外,可能还需要考虑如何管理每个端口的私有数据,以及错误处理机制,确保在某个端口初始化失败时能够正确回滚之前的操作。 回想之前的回答,我已经提到了探测函数中的多端口处理,用了一个循环遍历的例子。现在需要扩展这部分内容,详细说明端口添加的步骤、关键数据结构和API,以及调试技巧。可能需要包括代码示例,比如使用platform_get_resource多次获取不同端口资源,或者使用循环注册多个设备。 另外,用户可能对内核子系统如何管理多个端口感兴趣,比如串口子系统中的uart_add_one_port,或者网络设备中的register_netdev。需要解释这些API的作用,以及如何正确使用它们。 还要注意错误处理部分,确保用户了解在添加多个端口时,如果其中一个失败,如何释放已分配的资源,避免内存泄漏或资源冲突。比如使用devm管理资源,或者在失败时手动回滚。 可能还需要提到设备树(Device Tree)中如何配置多端口设备,比如每个端口的寄存器地址、中断号等属性,以及如何在驱动中解析这些信息。例如,通过遍历子节点来获取每个端口的配置。 最后,用户可能需要调试技巧,例如使用dev_dbg输出调试信息,或者通过sysfs和debugfs查看端口状态,确保每个端口都正确添加并初始化。 总结来说,用户需要的是端口添加的详细流程、关键代码实现、错误处理和调试方法,确保他们能够在自己的驱动中正确实现多端口支持,并解决可能遇到的问题。</think>在Linux驱动开发中,**端口添加** 是管理多接口设备的核心操作(如串口控制器、网络交换芯片等)。以下从内核实现角度进行深度解析: --- ### 一、核心概念 1. **物理端口** - 实际存在的硬件接口(如UART的TX/RX引脚) - 对应寄存器组地址偏移量:`base_addr + N * port_stride` 2. **逻辑端口** - 内核子系统抽象结构(如`struct uart_port`) - 通过`port->line`区分不同通道 3. **虚拟端口** ```c // 虚拟串口扩展示例 for (i=0; i<4; i++) { create_virt_port(master_dev, VIRT_BASE + i); } ``` --- ### 二、典型实现流程(以8250串口驱动为例) 1. **资源遍历** ```c struct resource *res; for (i = 0; ; i++) { res = platform_get_resource(pdev, IORESOURCE_MEM, i); // 按索引获取资源 if (!res) break; add_port(res->start, res->end - res->start + 1); } ``` 2. **端口结构初始化** ```c struct uart_port *port = &serial8250_ports[line]; port->iobase = base_addr; port->irq = irq_num; port->fifosize = 64; port->regshift = reg_shift; ``` 3. **层级注册** ```c ret = serial8250_register_port(port); if (ret < 0) { dev_err(dev, "Cannot register port %d, err=%d\n", line, ret); goto rollback; } ``` --- ### 三、关键数据结构 1. **端口标识符** ```c struct uart_8250_port { struct uart_port port; // 包含波特率/中断等基础配置 struct list_head list; // 用于维护全局端口链表 unsigned int capab; // 特殊能力标志 }; ``` 2. **资源描述符** ```c struct resource { resource_size_t start; // 物理起始地址 resource_size_t end; // 结束地址 unsigned long flags; // 资源类型(IORESOURCE_MEM/IRQ等) }; ``` --- ### 四、多端口管理策略 1. **静态分配**(固定端口数) ```c #define MAX_PORTS 8 static struct uart_port ports[MAX_PORTS]; ``` 2. **动态扩展** ```c struct uart_port *new_port = kzalloc(sizeof(*new_port), GFP_KERNEL); list_add_tail(&new_port->list, &active_ports); ``` 3. **热插拔支持** ```c // 热添加事件处理 int hotplug_add_port(struct device *dev) { struct new_port_config cfg; parse_hotplug_params(dev, &cfg); return serial_add_one_port(&serial8250_reg, &cfg.port); } ``` --- ### 五、错误处理模式 1. **渐进式回滚** ```c for (i=0; i<added_ports; i++) { serial8250_unregister_port(i); iounmap(ports[i].membase); } ``` 2. **资源自动释放** ```c port->membase = devm_ioremap_resource(dev, res); // 由设备资源管理自动回收 ``` --- ### 六、高级场景实现 1. **端口复用**(如RS485模式切换) ```c static void rs485_mode_enable(struct uart_port *port) { unsigned char mcr = serial_in(port, UART_MCR); mcr |= UART_MCR_RS485_EN; serial_out(port, UART_MCR, mcr); } ``` 2. **DMA通道绑定** ```c port->dma = dma_request_chan(dev, "rx-tx"); if (IS_ERR(port->dma)) { dev_warn(dev, "DMA not available, fallback to PIO\n"); } ``` --- ### 七、调试技术 1. **端口状态检查** ```bash dmesg | grep ttyS # 查看已注册串口 cat /proc/tty/driver/serial # 显示详细配置 ``` 2. **寄存器级调试** ```c dev_dbg(dev, "LCR: 0x%02x, MCR: 0x%02x\n", serial_in(port, UART_LCR), serial_in(port, UART_MCR)); ``` --- ### 八、性能优化 1. **批量操作** ```c for (i=0; i<num_ports; i++) { ports[i].fifo_timeout = optimized_value; // 减少循环次数 } ``` 2. **延迟初始化** ```c INIT_DELAYED_WORK(&port->lazy_init_work, delayed_init); schedule_delayed_work(&port->lazy_init_work, msecs_to_jiffies(100)); ``` 端口添加的实现质量直接影响设备的多通道性能,需特别注意资源冲突和锁竞争问题。实际开发中建议结合`ftrace`和`perf`工具进行并发分析。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值