AVX优化
InfiniteChaos
~
展开
-
C++使用OpenMP和AVX2优化图像中卷积算法
C++卷积算法优化原创 2023-08-09 09:56:54 · 163 阅读 · 0 评论 -
使用C++的OpenCV实现Halcon的PointsHarris
Halcon算法实现原创 2023-06-09 08:52:01 · 246 阅读 · 0 评论 -
AVX-实现_mm256_abs_ps
static const _declspec(align(16)) int _ps256_inv_sign_mask[8] = { ~0x80000000, ~0x80000000, ~0x80000000, ~0x80000000 ,~0x80000000, ~0x80000000, ~0x80000000, ~0x80000000 };__m256 _mm256_abs_ps(__m256 x){return _mm256_and_ps(x,*(__m256 *)_ps256_inv_sign_m原创 2021-08-16 15:29:07 · 402 阅读 · 0 评论 -
AVX优化矩阵乘法
1.看了OpenBlas的矩阵乘法优化 尝试写下AVX版本的矩阵优化2.在单线程情况下 单精度 10001000的矩阵乘10001000 运行100次 取平均值Pytorch-Mkl 23.msNumpy(应该也是用的MKL) 23.ms我的 38.ms以下贴上代码void addDot8x8Pack(int k, float *A, float *B, float *C, int n) { int p; float *bp0_pntr = B; __m256原创 2022-11-24 16:37:58 · 2329 阅读 · 2 评论