NEON
小牛蛋
关注Linux下多线程开发 并行与分布式计算 对区块链 机器学习 密码学有浓厚兴趣
展开
-
NEON 3x3 max pool示例代码
3x3的池化 先分别读取三列 constexpr const int pool_size = 3; const float32x4_t top_data = vld1q_f32(reinterpret_cast(input_top_ptr + input.offset())); const float32x4_t middle_data = vld1q_f32(r原创 2017-10-16 17:56:02 · 3396 阅读 · 0 评论 -
ARM NEON编译错误
在aarch64的ARM处理器上编译NEON程序,出现如下错误:/usr/lib/gcc/arm-linux-gnueabihf/6/include/arm_neon.h:5792:1: error: inlining failed in call to always_inline ‘vdupq_n_s32’: target specific option mismatch vdu原创 2017-11-27 20:00:23 · 5266 阅读 · 2 评论