汇编 AVX 增强功能指令

最新推荐文章于 2024-10-11 20:19:03 发布

程序猴--小川

最新推荐文章于 2024-10-11 20:19:03 发布

阅读量849

点赞数 25

文章标签：汇编

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_73378754/article/details/138891776

版权

VBROADCASTF128	VBROADCASTF128 ymm1, m128 Broadcast 128 bits of floating-point data in mem to low and high 128-bits in ymm1. 储在内存中的128位浮点值广播到一个256位YMM寄存器的所有元素。这意味着存储在内存中的相同128位值将被复制到YMM寄存器的所有元素中 VBROADCASTF128 (VEX.256 Encoded Version) temp := SRC[127:0] DEST[127:0] := temp DEST[255:128] := temp DEST[MAXVL-1:256] := 0
VBROADCASTSD	VBROADCASTSD ymm1, m64 Broadcast double precision floating-point element in mem to four locations in ymm1. 存储在内存中的64位浮点值广播到一个256位YMM寄存器的所有元素。这意味着存储在内存中的相同64位值将被复制到YMM寄存器的所有元素中 VBROADCASTSD (VEX.256 Encoded Version) temp := SRC[63:0] DEST[63:0] := temp DEST[127:64] := temp DEST[191:128] := temp DEST[255:192] := temp DEST[MAXVL-1:256] := 0
VBROADCASTSS	VBROADCASTSS xmm1, m32 Broadcast single precision floating-point element in mem to four locations in xmm1. 将存储在内存中的32位浮点值广播到一个128位XMM寄存器的所有元素。这意味着存储在内存中的相同32位值将被复制到XMM寄存器的所有元素中 VBROADCASTSS ymm1, m32 Broadcast single precision floating-point element in mem to eight locations in ymm1. 将存储在内存中的32位浮点值广播到一个256位YMM寄存器的所有元素。这意味着存储在内存中的相同32位值将被复制到YMM寄存器的所有元素中。 VBROADCASTSS (128-bit Version VEX and Legacy) xmm寄存器 temp := SRC[31:0] DEST[31:0] := temp DEST[63:32] := temp DEST[95:64] := temp DEST[127:96] := temp DEST[MAXVL-1:128] := 0 VBROADCASTSS (VEX.256 Encoded Version) ymm寄存器 temp := SRC[31:0] DEST[31:0] := temp DEST[63:32] := temp DEST[95:64] := temp DEST[127:96] := temp DEST[159:128] := temp DEST[191:160] := temp DEST[223:192] := temp DEST[255:224] := temp DEST[MAXVL-1:256] := 0
VEXTRACTF128	VEXTRACTF128 xmm1/m128, ymm2, imm8 Extract 128 bits of packed floating-point values from ymm2 and store results in xmm1/m128. 从256位YMM寄存器`ymm2`的低半部分或高半部分提取一个128位浮点值，并根据立即数`imm8`将其存储到目标XMM寄存器`xmm1`或内存位置`m128`中。 VEXTRACTF128 (Memory Destination Form) CASE (imm8[0]) OF 0: DEST[127:0] := SRC1[127:0] 1: DEST[127:0] := SRC1[255:128] ESAC. VEXTRACTF128 (Register Destination Form) CASE (imm8[0]) OF 0: DEST[127:0] := SRC1[127:0] 1: DEST[127:0] := SRC1[255:128] ESAC. DEST[MAXVL-1:128] := 0
VINSERTF128	VINSERTF128 ymm1, ymm2, xmm3/m128, imm8 Insert 128 bits of packed floating-point values from xmm3/m128 and the remaining values from ymm2 into ymm1. 根据立即数`imm8`将来自XMM寄存器`xmm3`或内存位置`m128`的128位浮点值插入到256位YMM寄存器`ymm1`的相应半部分。 VINSERTF128 (VEX encoded version) TEMP[255:0] := SRC1[255:0] CASE (imm8[0]) OF 0: TEMP[127:0] := SRC2[127:0] 1: TEMP[255:128] := SRC2[127:0] ESAC DEST := TEMP
VMASKMOVPS	VMASKMOVPS xmm1, xmm2, m128 Conditionally load packed single-precision values from m128 using mask in xmm2 and store in xmm1. 在xmm2中使用掩码，有条件地从m128加载压缩单精度值，并存储在xmm1中。 VMASKMOVPS ymm1, ymm2, m256 Conditionally load packed single-precision values from m256 using mask in ymm2 and store in ymm1. 使用ymm2中的掩码有条件地加载m256中的压缩单精度值，并存储在ymm1中。 VMASKMOVPS m128, xmm1, xmm2 Conditionally store packed single-precision values from xmm2 using mask in xmm1. 使用xmm1中的掩码有条件地存储xmm2中的压缩单精度值。 VMASKMOVPS m256, ymm1, ymm2 Conditionally store packed single-precision values from ymm2 using mask in ymm1. 使用ymm1中的掩码有条件地存储来自ymm2的压缩单精度值。 VMASKMOVPS -128-bit load DEST[31:0] := IF (SRC1[31]) Load_32(mem) ELSE 0 DEST[63:32] := IF (SRC1[63]) Load_32(mem + 4) ELSE 0 DEST[95:64] := IF (SRC1[95]) Load_32(mem + 8) ELSE 0 DEST[127:97] := IF (SRC1[127]) Load_32(mem + 12) ELSE 0 DEST[MAXVL-1:128] := 0 VMASKMOVPS - 256-bit load DEST[31:0] := IF (SRC1[31]) Load_32(mem) ELSE 0 DEST[63:32] := IF (SRC1[63]) Load_32(mem + 4) ELSE 0 DEST[95:64] := IF (SRC1[95]) Load_32(mem + 8) ELSE 0 DEST[127:96] := IF (SRC1[127]) Load_32(mem + 12) ELSE 0 DEST[159:128] := IF (SRC1[159]) Load_32(mem + 16) ELSE 0 DEST[191:160] := IF (SRC1[191]) Load_32(mem + 20) ELSE 0 DEST[223:192] := IF (SRC1[223]) Load_32(mem + 24) ELSE 0 DEST[255:224] := IF (SRC1[255]) Load_32(mem + 28) ELSE 0 VMASKMOVPS - 128-bit store IF (SRC1[31]) DEST[31:0] := SRC2[31:0] IF (SRC1[63]) DEST[63:32] := SRC2[63:32] IF (SRC1[95]) DEST[95:64] := SRC2[95:64] IF (SRC1[127]) DEST[127:96] := SRC2[127:96] VMASKMOVPS - 256-bit store IF (SRC1[31]) DEST[31:0] := SRC2[31:0] IF (SRC1[63]) DEST[63:32] := SRC2[63:32] IF (SRC1[95]) DEST[95:64] := SRC2[95:64] IF (SRC1[127]) DEST[127:96] := SRC2[127:96] IF (SRC1[159]) DEST[159:128] :=SRC2[159:128] IF (SRC1[191]) DEST[191:160] := SRC2[191:160] IF (SRC1[223]) DEST[223:192] := SRC2[223:192] IF (SRC1[255]) DEST[255:224] := SRC2[255:224]
VMASKMOVPD	VMASKMOVPD xmm1, xmm2, m128 Conditionally load packed double precision values from m128 using mask in xmm2 and store in xmm1. 在xmm2中使用掩码，有条件地从m128加载压缩双精度值，并存储在xmm1中。 VMASKMOVPD ymm1, ymm2, m256 Conditionally load packed double precision values from m256 using mask in ymm2 and store in ymm1. 使用ymm2中的掩码，有条件地加载m256中的压缩双精度值，并存储在ymm1中。 VMASKMOVPD m128, xmm1, xmm2 Conditionally store packed double precision values from xmm2 using mask in xmm1. 使用xmm1中的掩码有条件地存储xmm2中的压缩双精度值。 VMASKMOVPD m256, ymm1, ymm2 Conditionally store packed double precision values from ymm2 using mask in ymm1. 使用ymm1中的掩码有条件地存储来自ymm2的压缩双精度值。 VMASKMOVPD - 128-bit load DEST[63:0] := IF (SRC1[63]) Load_64(mem) ELSE 0 DEST[127:64] := IF (SRC1[127]) Load_64(mem + 16) ELSE 0 DEST[MAXVL-1:128] := 0 VMASKMOVPD - 256-bit load DEST[63:0] := IF (SRC1[63]) Load_64(mem) ELSE 0 DEST[127:64] := IF (SRC1[127]) Load_64(mem + 8) ELSE 0 DEST[195:128] := IF (SRC1[191]) Load_64(mem + 16) ELSE 0 DEST[255:196] := IF (SRC1[255]) Load_64(mem + 24) ELSE 0 VMASKMOVPD - 128-bit store IF (SRC1[63]) DEST[63:0] := SRC2[63:0] IF (SRC1[127]) DEST[127:64] := SRC2[127:64] VMASKMOVPD - 256-bit store IF (SRC1[63]) DEST[63:0] := SRC2[63:0] IF (SRC1[127]) DEST[127:64] := SRC2[127:64] IF (SRC1[191]) DEST[191:128] := SRC2[191:128] IF (SRC1[255]) DEST[255:192] := SRC2[255:192]
VPERMILPD	VPERMILPD xmm1, xmm2, xmm3/m128 Permute double precision floating-point values in xmm2 using controls from xmm3/m128 and store result in xmm1. 使用xmm3/m128中的控件对xmm2中的双精度浮点值进行Permute处理，并将结果存储在xmm1中。 VPERMILPD ymm1, ymm2, ymm3/m256 Permute double precision floating-point values in ymm2 using controls from ymm3/m256 and store result in ymm1. 使用ymm3/m256中的控件对ymm2中的双精度浮点值进行静音处理，并将结果存储在ymm1中。 VPERMILPD xmm1, xmm2/m128, imm8 Permute double precision floating-point values in xmm2/m128 using controls from imm8. 使用imm8中的控件对xmm2/m128中的双精度浮点值进行Permute处理。 VPERMILPD ymm1, ymm2/m256, imm8 Permute double precision floating-point values in ymm2/m256 using controls from imm8. 使用imm8中的控件对ymm2/m256中的双精度浮点值进行静音处理。 VPERMILPD (256-bit immediate version) IF (imm8[0] = 0) THEN DEST[63:0] := SRC1[63:0] IF (imm8[0] = 1) THEN DEST[63:0] := SRC1[127:64] IF (imm8[1] = 0) THEN DEST[127:64] := SRC1[63:0] IF (imm8[1] = 1) THEN DEST[127:64] := SRC1[127:64] IF (imm8[2] = 0) THEN DEST[191:128] := SRC1[191:128] IF (imm8[2] = 1) THEN DEST[191:128] := SRC1[255:192] IF (imm8[3] = 0) THEN DEST[255:192] := SRC1[191:128] IF (imm8[3] = 1) THEN DEST[255:192] := SRC1[255:192] DEST[MAXVL-1:256] := 0 VPERMILPD (128-bit immediate version) IF (imm8[0] = 0) THEN DEST[63:0] := SRC1[63:0] IF (imm8[0] = 1) THEN DEST[63:0] := SRC1[127:64] IF (imm8[1] = 0) THEN DEST[127:64] := SRC1[63:0] IF (imm8[1] = 1) THEN DEST[127:64] := SRC1[127:64] DEST[MAXVL-1:128] := 0 VPERMILPD (256-bit variable version) IF (SRC2[1] = 0) THEN DEST[63:0] := SRC1[63:0] IF (SRC2[1] = 1) THEN DEST[63:0] := SRC1[127:64] IF (SRC2[65] = 0) THEN DEST[127:64] := SRC1[63:0] IF (SRC2[65] = 1) THEN DEST[127:64] := SRC1[127:64] IF (SRC2[129] = 0) THEN DEST[191:128] := SRC1[191:128] IF (SRC2[129] = 1) THEN DEST[191:128] := SRC1[255:192] IF (SRC2[193] = 0) THEN DEST[255:192] := SRC1[191:128] IF (SRC2[193] = 1) THEN DEST[255:192] := SRC1[255:192] DEST[MAXVL-1:256] := 0 VPERMILPD (128-bit variable version) IF (SRC2[1] = 0) THEN DEST[63:0] := SRC1[63:0] IF (SRC2[1] = 1) THEN DEST[63:0] := SRC1[127:64] IF (SRC2[65] = 0) THEN DEST[127:64] := SRC1[63:0] IF (SRC2[65] = 1) THEN DEST[127:64] := SRC1[127:64] DEST[MAXVL-1:128] := 0
VPERMILPS	VPERMILPS xmm1, xmm2, xmm3/m128 Permute single-precision floating-point values in xmm2 using controls from xmm3/m128 and store result in xmm1. 使用xmm3/m128中的控件对xmm2中的单精度浮点值进行Permute处理，并将结果存储在xmm1中。 VPERMILPS xmm1, xmm2/m128, imm8 Permute single-precision floating-point values in xmm2/m128 using controls from imm8 and store result in xmm1. 使用imm8中的控件对xmm2/m128中的单精度浮点值进行Permute处理，并将结果存储在xmm1中。 VPERMILPS ymm1, ymm2, ymm3/m256 Permute single-precision floating-point values in ymm2 using controls from ymm3/m256 and store result in ymm1. 使用ymm3/m256和的控件对ymm2中的单精度浮点值进行静音处理 VPERMILPS ymm1, ymm2/m256, imm8 Permute single-precision floating-point values in ymm2/m256 using controls from imm8 and store result in ymm1. 使用imm8中的控件对ymm2/m256中的单精度浮点值进行静音处理，并将结果存储在ymm1中。 Select4(SRC, control) { CASE (control[1:0]) OF 0: TMP := SRC[31:0]; 1: TMP := SRC[63:32]; 2: TMP := SRC[95:64]; 3: TMP := SRC[127:96]; ESAC; RETURN TMP } VPERMILPS (256-bit immediate version) DEST[31:0] := Select4(SRC1[127:0], imm8[1:0]); DEST[63:32] := Select4(SRC1[127:0], imm8[3:2]); DEST[95:64] := Select4(SRC1[127:0], imm8[5:4]); DEST[127:96] := Select4(SRC1[127:0], imm8[7:6]); DEST[159:128] := Select4(SRC1[255:128], imm8[1:0]); DEST[191:160] := Select4(SRC1[255:128], imm8[3:2]); DEST[223:192] := Select4(SRC1[255:128], imm8[5:4]); DEST[255:224] := Select4(SRC1[255:128], imm8[7:6]); VPERMILPS (128-bit immediate version) DEST[31:0] := Select4(SRC1[127:0], imm8[1:0]); DEST[63:32] := Select4(SRC1[127:0], imm8[3:2]); DEST[95:64] := Select4(SRC1[127:0], imm8[5:4]); DEST[127:96] := Select4(SRC1[127:0], imm8[7:6]); DEST[MAXVL-1:128] := 0 VPERMILPS (256-bit variable version) DEST[31:0] := Select4(SRC1[127:0], SRC2[1:0]); DEST[63:32] := Select4(SRC1[127:0], SRC2[33:32]); DEST[95:64] := Select4(SRC1[127:0], SRC2[65:64]); DEST[127:96] := Select4(SRC1[127:0], SRC2[97:96]); DEST[159:128] := Select4(SRC1[255:128], SRC2[129:128]); DEST[191:160] := Select4(SRC1[255:128], SRC2[161:160]); DEST[223:192] := Select4(SRC1[255:128], SRC2[193:192]); DEST[255:224] := Select4(SRC1[255:128], SRC2[225:224]); DEST[MAXVL-1:256] := 0 VPERMILPS (128-bit variable version) DEST[31:0] := Select4(SRC1[127:0], SRC2[1:0]); DEST[63:32] := Select4(SRC1[127:0], SRC2[33:32]); DEST[95:64] :=Select4(SRC1[127:0], SRC2[65:64]); DEST[127:96] := Select4(SRC1[127:0], SRC2[97:96]); DEST[MAXVL-1:128] := 0
VPERM2F128	VPERM2F128 ymm1, ymm2, ymm3/m256, imm8 Permute 128-bit floating-point fields in ymm2 and ymm3/mem using controls from imm8 and store result in ymm1. 使用imm8中的控件对ymm2和ymm3/mem中的128位浮点字段进行静音处理，并将结果存储在ymm1中。 VPERM2F128 CASE IMM8[1:0] of 0: DEST[127:0] := SRC1[127:0] 1: DEST[127:0] := SRC1[255:128] 2: DEST[127:0] := SRC2[127:0] 3: DEST[127:0] := SRC2[255:128] ESAC CASE IMM8[5:4] of 0: DEST[255:128] := SRC1[127:0] 1: DEST[255:128] := SRC1[255:128] 2: DEST[255:128] := SRC2[127:0] 3: DEST[255:128] := SRC2[255:128] ESAC IF (imm8[3]) DEST[127:0] := 0 FI IF (imm8[7]) DEST[MAXVL-1:128] := 0 FI Int
VTESTPS	VTESTPS xmm1, xmm2/m128 Set ZF and CF depending on sign bit AND and ANDN of packed single-precision floating-point sources. 根据压缩单精度浮点源的符号位and和ANDN设置ZF和CF。 VTESTPS ymm1, ymm2/m256 Set ZF and CF depending on sign bit AND and ANDN of packed single-precision floating-point sources. 根据压缩单精度浮点源的符号位and和ANDN设置ZF和CF。 VTESTPS (128-bit version) TEMP[127:0] := SRC[127:0] AND DEST[127:0] IF (TEMP[31] = TEMP[63] = TEMP[95] = TEMP[127] = 0) THEN ZF := 1; ELSE ZF := 0; TEMP[127:0] := SRC[127:0] AND NOT DEST[127:0] IF (TEMP[31] = TEMP[63] = TEMP[95] = TEMP[127] = 0) THEN CF := 1; ELSE CF := 0; DEST (unmodified) AF := OF := PF := SF := 0; VTESTPS (VEX.256 encoded version) TEMP[255:0] := SRC[255:0] AND DEST[255:0] IF (TEMP[31] = TEMP[63] = TEMP[95] = TEMP[127]= TEMP[160] =TEMP[191] = TEMP[224] = TEMP[255] = 0) THEN ZF := 1; ELSE ZF := 0; TEMP[255:0] := SRC[255:0] AND NOT DEST[255:0] IF (TEMP[31] = TEMP[63] = TEMP[95] = TEMP[127]= TEMP[160] =TEMP[191] = TEMP[224] = TEMP[255] = 0) THEN CF := 1; ELSE CF := 0; DEST (unmodified) AF := OF := PF := SF := 0;
VTESTPD	VTESTPD xmm1, xmm2/m128 Set ZF and CF depending on sign bit AND and ANDN of packed double precision floating-point sources. 根据压缩双精度浮点源的符号位and和ANDN设置ZF和CF。 VTESTPD ymm1, ymm2/m256 Set ZF and CF depending on sign bit AND and ANDN of packed double precision floating-point sources. 根据压缩双精度浮点源的符号位and和ANDN设置ZF和CF。 VTESTPD (128-bit version) TEMP[127:0] := SRC[127:0] AND DEST[127:0] IF ( TEMP[63] = TEMP[127] = 0) THEN ZF := 1; ELSE ZF := 0; TEMP[127:0] := SRC[127:0] AND NOT DEST[127:0] IF ( TEMP[63] = TEMP[127] = 0) THEN CF := 1; ELSE CF := 0; DEST (unmodified) AF := OF := PF := SF := 0; VTESTPD (VEX.256 encoded version) TEMP[255:0] := SRC[255:0] AND DEST[255:0] IF (TEMP[63] = TEMP[127] = TEMP[191] = TEMP[255] = 0) THEN ZF := 1; ELSE ZF := 0; TEMP[255:0] := SRC[255:0] AND NOT DEST[255:0] IF (TEMP[63] = TEMP[127] = TEMP[191] = TEMP[255] = 0) THEN CF := 1; ELSE CF := 0; DEST (unmodified) AF := OF := PF := SF := 0;
VZEROALL	Zero some of the XMM, YMM, and ZMM registers. Zero all YMM registers.
VZEROUPPER	Zero bits in positions 128 and higher of some YMM and ZMM registers. Zero upper 128 bits of all YMM registers

程序猴--小川

关注

25
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

程序猴--小川 CSDN认证博客专家 CSDN认证企业博客

码龄2年

18: 原创

124万+: 周排名

9万+: 总排名

1万+: 访问

: 等级

537: 积分

197: 粉丝

355: 获赞

9: 评论

262: 收藏

私信

关注

热门文章

分类专栏

汇编手册 1篇

最新评论

汇编 intel AES-NI AND PCLMULQDQ 指令
普通网友: 文章内容通俗易懂，适合不同层次的读者。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
汇编 SSE4(SSE4.1) 指令简介
CSDN-Ada助手: 恭喜您写了第8篇博客《汇编 SSE4(SSE4.1) 指令简介》，内容十分精彩！您对SSE4指令的介绍清晰且详细，让读者能够快速了解这一技术。接下来，我建议您可以深入探讨SSE4指令在实际项目中的应用场景，或者结合其他相关技术进行进一步的研究和分享。期待您的下一篇博客，继续为我们带来更多有价值的内容！
汇编 SSE4.2 指令简介
CSDN-Ada助手: 恭喜您撰写了第9篇博客《汇编 SSE4.2 指令简介》，内容涉及到了技术领域的深入探讨，展示了您对于这一领域的专业知识和研究精神。希望您能继续保持创作的热情和耐心，不断深入挖掘和分享更多有价值的内容。或许下一步可以考虑结合实际案例或者应用场景，让读者更加直观地理解和应用所学知识。期待您更多的精彩文章，加油！
汇编 intel SSSE3 指令简介
CSDN-Ada助手: 恭喜您撰写了第10篇博客《汇编 intel SSSE3 指令简介》，对于分享这样专业的知识点，我们深感鼓舞！希望您能继续坚持创作，不断提升自己的写作水平。或许可以考虑分享一些实际案例或者应用场景，让读者更好地理解和运用这些知识。期待您的更多精彩内容！
汇编 intel AES-NI AND PCLMULQDQ 指令
CSDN-Ada助手: 恭喜您撰写了这篇关于汇编 intel AES-NI AND PCLMULQDQ 指令的博客！您对这些指令的深入研究让我们受益匪浅。希望您能继续保持创作的热情和努力，探索更多有趣的主题。或许在下一篇博客中可以探讨一下如何优化指令的使用，或者分享一些实践经验，让读者更好地理解和应用这些指令。期待您的下一篇作品！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。