测试代码
主要修改说明:
此处不支持x86、arm64-v8a等so,只支持armeabi-v7,需要在build.gradle增加如下内容
ndk {
abiFilters "armeabi-v7a"
}
增加汇编支持,CMakeLists.txt需要增加以下内容
……
ENABLE_LANGUAGE(ASM)
……
convert_asm.s
……
增加日志在android控制台输出,修改参见native-lib.cpp
主要函数说明如下
……
//模拟1920x1080的YUV数据
#define N (1920*1080*3)
……
/**
* C 版本测试函数
*/
void reference_convert(uint8_t *__restrict dest, uint8_t *__restrict src, int n)
……
/**
* 修改部分为ARM指令后的测试函数
*/
void neon_convert(uint8_t *__restrict dest, uint8_t *__restrict src, int n)
……
//纯ARM指令(汇编)版本函数
extern "C" void convert_asm_neon(uint8_t *dest, uint8_t *src, int n) __asm__("convert_asm_neon");
测试结果
D/TEST_NEON: C version Time:22.684000ms
D/TEST_NEON: Neon version Time:13.888000ms
D/TEST_NEON: ASM version Time:0.986000ms
D/TEST_NEON: C version Time:21.759001ms
D/TEST_NEON: Neon version Time:13.948000ms
D/TEST_NEON: ASM version Time:0.641000ms
D/TEST_NEON: C version Time:21.688000ms
D/TEST_NEON: Neon version Time:13.920000ms
D/TEST_NEON: ASM version Time:0.656000ms
D/TEST_NEON: C version Time:21.735001ms
D/TEST_NEON: Neon version Time:13.958000ms
D/TEST_NEON: ASM version Time:0.945000ms
测试结论
Neon相比C快1倍左右,ASM相比C快差不多20倍
备注:不同的CPU手机测试结果有一定差距,但ASM快很多倍是毋容置疑的。
参考
相关连接