SIMD
文章平均质量分 60
zhxonmir2
SIMD学些日志,发出来抛砖引玉
展开
-
设备通讯中,有时会遇到大小端的问题,需要“交换字节序“
原代码:int k = 0;for(k = 0;k+=2)优化1://要留下\0的位置k++)pdst[k] =ntohs(psrc[k]);//\0结尾,防止访问时越界优化2:优化2:.align 64# 要求: AVX2# dst,src: 不要求地址32字节对齐, 但是要求大小是32字节的整数倍# srcc:src有效数据的长度, 可以不是32字节的整数倍.align 64ret# 要求: AVX512VL + AVX512BW。原创 2023-04-23 15:26:49 · 227 阅读 · 0 评论 -
SIMD CRC16 AVX512
之前写了个pshufb + pdep版本的, 速度就快了2,3倍, 最近学习了AVX512, 就拿AVX512写了下, 果然是AVX512啊, 快了近百倍:.codeadd rcx, 8add rcx, 8add rcx, 8add rcx, 8add rcx, 8add rcx, 8add rcx, 8retendint i;for (i = 0;i < 16;i++)int main()count++)i < 32;i++)原创 2023-04-23 15:05:19 · 158 阅读 · 0 评论 -
AT&T嵌入汇编中, 如何表达 {k1}{z}
intel:gas:":::);原创 2023-04-23 14:57:33 · 60 阅读 · 0 评论 -
intrin用起来有点不方便哦
SIMD intrin内置函数原创 2023-01-05 15:37:35 · 481 阅读 · 0 评论 -
SIMD PCMPISTRI有个坑哦
SIMD PCMPISTRI strstr原创 2023-01-05 15:33:02 · 92 阅读 · 0 评论 -
SIMD CRC16
SIMD CRC16原创 2023-01-05 14:26:37 · 188 阅读 · 1 评论