硬件加速
战国沙琪玛
地球之旅中
展开
-
如何进行对Cache友好的编程
先引入一个参考链接,博主对Catch的起源、运行原理介绍的很清楚,还是用Java的一些开发例子做了说明,对于大数据处理(例如图像处理)还是有很大帮助的,本文展示一些嵌入式的例子以及评估方式。...原创 2021-06-10 14:45:54 · 253 阅读 · 0 评论 -
NEON + OpenMP测试
在嵌入式的开发中,一直有在使用OpenMP和NEON加速,这次对二者的加速效果做了一个对比,包括二者的组合效果,测试平台为RK3399,因为只测试了加法的情况,其他的运行逻辑需要再实际使用zho原创 2021-06-08 14:08:52 · 692 阅读 · 0 评论 -
如何获得memcpy的最佳效率
当进行内存拷贝的时候,我们一般都会使用memcpy函数,尽管该函数经过不断的优化,但是有时候我们会发现直接使用该函数的效率并不是最高的。下面以图片复制来进行效率测试,图片共有5种分辨率,测试平台为ARM contex-A15。#include <QCoreApplication>#include <time.h>#include <sys/time.h>#include <arm_neon.h>int main(int argc...原创 2020-07-24 17:24:27 · 4546 阅读 · 4 评论