使用MMX、SSE、AVX等SIMD指令集进行汇编加速时,若地址是8、16、32字节对齐时,能使用对齐的数据读取、写入指令,从而进一步优化速度。
头文件:mem_align.h
/*
FILE: mem_align.h
*/
#ifndef _MEM_AQLIGN_H_
#define _MEM_AQLIGN_H_
#define align_mem_get(pVar,size,align_size)\
unsigned char * pVar_mem=(unsigned char *)(malloc(size+align_size));\
unsigned char * pVar = pVar_mem+(align_size-(int)pVar_mem&0xf)
#define align_mem_free(pVar) \
free(pVar_mem); \
pVar = 0
#endif
使用:
align_mem_get(pBuffer,30,16);
align_mem_free(pBuffer);