深入理解ngx_align_ptr宏及内存管理

最新推荐文章于 2024-04-18 09:01:59 发布

niitlcj

最新推荐文章于 2024-04-18 09:01:59 发布

阅读量6.5k

点赞数

分类专栏： nginx代碼分析

nginx代碼分析专栏收录该内容

1 篇文章 0 订阅

订阅专栏

http://blog.csdn.net/cywosp/article/details/7044288

nginx 内存池的内存地址对齐和长度按照2的幂取整

内存池的里面返回的地址，都是经过对齐处理的，这样使用这个对齐的地址比如做memcpy的时候，不用跨cache line 性能更好吧。

又学了一招。

看看使用的代码

http://trac.nginx.org/nginx/browser/nginx/trunk/src/core/ngx_palloc.c

#ifndef NGX_ALIGNMENT
#define NGX_ALIGNMENT sizeof(unsigned long) /* platform word */
#endif

#define ngx_align(d, a)     (((d) + (a - 1)) & ~(a - 1))
#define ngx_align_ptr(p, a)                                                   \
    (u_char *) (((uintptr_t) (p) + ((uintptr_t) a - 1)) & ~((uintptr_t) a - 1))

先分析 (((d) + (a - 1)) & ~(a - 1))表达式
理解表达式 ~(a - 1)注意，其中a为2的幂，设右数第n位为非零位，则a-1为右数的n-1位均为1，则有~(a-1)为最后的n-1位全为0；

显然可得一个数和2的幂进行减一取反再按位与操作，即为该数减去（其与a求余的值）

这种计算地址或者长度对齐，取整的宏还是很有用的。cpu访问对齐的数据较快，不对齐的的int之类的，有可能区要多次内存访问才能取到值。

向上取整倍数，ngx_align内存对齐的宏，对于a，传入CPU的二级cache的line大小，通过ngx_cpuinf函数，可以获得ngx_cacheline_size的大小，一般intel为64或128

计算宏ngx_align(1, 64)=64，只要输入d<64，则结果总是64，如果输入d=65，则结果为128,以此类推。

进行内存池管理的时候，对于小于64字节的内存，给分配64字节，使之总是cpu二级缓存读写行的大小倍数，从而有利cpu二级缓存取速度和效率。

ngx_cpuinfo函数实际是调用了汇编代码，获取cpu二级缓存大小！

//==================================================

上面式子，当a等于2的幂的时候，比如，4，8，16等值时，

d加上（a-1) 之后的值肯定要比最小的a的倍数要大的。因为a为2的幂，所以（a - 1）刚好后面几位都是连续的1，取反之后再相与一下之后，就把小于a的余数部分丢掉了。不过如果a不是2的幂，比如a=3， d=1 ，那么推算一下，上面的计算就不成立了。

这种计算地址或者长度对齐，取整的宏还是很有用的。cpu访问对齐的数据跟快把，不对齐的的int之类的，有可能区要多次内存访问才能取到值出来。写个简单的字符串内存池，AllocateString时打算把所有的字符串放到一个连续的内存块上，觉得还是把长度取整一下比较好。这样后续的对字符串的memcpy就是内存字对齐，更好吧。

//=================================================

niitlcj

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
深入理解ngx_align_ptr宏及内存管理

nginx 内存池的内存地址对齐和长度按照2的幂取整内存池的里面返回的地址，都是经过对齐处理的，这样使用这个对齐的地址比如做memcpy的时候，不用跨cache line 性能更好吧。又学了一招。看看使用的代码http://trac.nginx.org/nginx/browser/nginx/trunk/src/core/ngx_palloc.c
复制链接

扫一扫