内存对齐公式推导
- 调用avx2、neon等框架加速运算时,都需要进行内存对齐操作,本文对ncnn框架中的内存对齐代码,原理进行推导.
- 首先解释一下内存对齐操作的功能,如下所示,传入参数sz以及n,返回的值满足一下几个要求:
- 必须大于等于sz
- 返回能够被n整数
- 必须是最小的
static NCNN_FORCEINLINE size_t alignSize(size_t sz, int n)
{
return (sz + n - 1) & -n;
}
详细的推导过程可以参考: ncnn的alignSize内存对齐公式推导