C++中使用SIMD的方法

最新推荐文章于 2025-06-13 09:24:53 发布

原创

最新推荐文章于 2025-06-13 09:24:53 发布 · 9.8k 阅读

51 ·

CC 4.0 BY-SA版权

写在前面

最近在看《游戏引擎架构》这本书，第四章介绍了利用simd来加速向量运算，感到十分有趣，在此记录下simd的使用方法。

1.SIMD是什么

SIMD全称为Single Instruction Multiple Data，即单指令多数据流。x86指令集中提供了一些SIMD指令，使用SIMD指令可以将多个操作数打包到一个专用的寄存器中进行运算。这样一来可以方便地进行小到向量内积，大到矩阵运算音视频解码等操作，同时获得一定的性能提升。
另外值得一提的是x86指令集中的SIMD指令集自发布以来并不是一成不变的，从最早的MMX（1996年）到SSE，再到后来的AVX、AVX2等，在使用时要加以区分尽量避免混用。

2.示例代码

2.1 主要数据结构

前文中也提到了，simd指令是对多个打包的操作数进行运算，所以C++中提供了相应的数据结构来存储这些打包的数据，用浮点数来举例说，一个单精度浮点数占4个字节也就是32位，我们要同时运算四个浮点数的话就需要将其封装为长为16字节（128位）的数据包。这样的数据结构在程序中以__m128的形式来表示。除此之外还有很多封装例如

__m64				// 64位紧缩整数（MMX）
__m128d				// 128位紧缩双精度（SSE2）
__m128i				// 128位紧缩整数（SSE2）
__m256				// 256位紧缩单精度（AVX） 
__m256

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

9Kalikali

关注关注

7
点赞
踩
51

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

C++ SIMD入门

sinat_26210035的博客

03-24

9449

Intel SIMD入门我前些日子优化一个程序，需要使用C++的SIMD。我查阅了很多资料，很多说的都不详细，遇到了很多问题，踩了很多坑，心灵很受伤。为了总结一下前些日子的学习情况，让后面需要学习SIMD的人少走弯路，写这篇博客。什么是SIMD？ SIMD的全称叫做，单指令集多数据（Single Instruction Multiple Data）。最直观的理解就是，向量计算。比如一个加法指...

C++中使用SIMD

u013939918的博客

06-24

1337

图7列出了使用SIMD技术的多种方法，我们先按从上至下的顺序简要介绍每一种，然后重点介绍汇编语言方法。图7 使用SIMD技术的多种方法第一种方法是使用著名的IPP库，IPP的全称是Intel Integrated Performance Primitives，是英特尔公司开发的一套跨平台软件函数库，提供了非常广泛的功能，包括各种常用的图形图像、音视频处理函数。因为其中的很多函数都已经使用SIMD技术做了优化，所以使用这个库是使用SIMD技术的一个快捷途径。通过链接https://soft.

参与评论您还未登录，请先登录后发表或查看评论

现代C++ ：使用SIMD 指令集实现高性能计算

热门推荐

06-02

3万+

C++ 编译器优化与SIMD指令集

泠山的博客

08-23

5981

刚才提到了 xmm 这个系列的寄存器，它们都有128128128位宽，可以容纳444个 float 或者222个 double。刚才的例子中，因为只有一个 float 存在一个128128128位的寄存器内，所以只用到了它最低的323232位。但是这样也没问题，因为我们刚才说的是，addss 它只会加最低位。这就要说到下一节将提到的 addss 了。刚才提到外部函数会让编译器无法优化，但如果是内部函数呢？内部函数是声明和定义在同一个文件，就是它定义在 func 调用它的相同文件。

「C/C++」C++ 之 SIMD技术介绍

何曾参静谧的博客

10-30

1240

SIMD，即单指令多数据流，是一种指令集架构，允许处理器同时处理多个数据项。与传统的SISD（Single Instruction, Single Data）和MISD（Multiple Instruction, Single Data）架构相比，SIMD架构显著提高了数据处理的吞吐量和计算效率。通过同时执行多个数据上的相同操作，SIMD能够充分利用现代处理器的并行处理能力。

使用SIMD技术提高C++程序性能

u012396362的博客

02-09

2316

作者：张银奎，《软件调试》和《格蠹汇编》作者，从事软件开发和研究十余年，对IA-32架构、操作系统内核、虚拟技术，尤其对软件调试有较深入的研究。微博ID：@dbgger 本文为《程序员》原创文章，未经允许不得转载，更多精彩文章请订阅《程序员》今天和C++同行谈谈如何提高自己的身价。编程语言只是工具，要把工具用到最合适的地方，扬其长且避其短，打造出有价值的软件产品，那么使用这工具的人自...

C++ 中的 SIMD 指令集如何使用

09-14

本文将详细介绍如何在C++中使用SIMD指令集，包括基本概念、编程方法和实际代码示例 SIMD指令集为C++程序员提供了强大的工具，以提高数据处理的效率。通过使用内联汇编、Intrinsics函数或依赖编译器的自动向量化，...

初见C++ SIMD

yang5256的博客

07-20

947

OpenMP、intel内置函数(头文件immintrin.h)g++ -O1 等可能会进行自动向量化，并且需要写-O1等才能启动omp的simd功能下面就这两种方法，写一下使用心得。朴素版本代码如下： navie和optWithSimd的速度相同； optWithSimd1相较navie1提高一倍； navie2和optWithSimd2的速度相同；optWithSimd在高长度的情况下较navie快 optWithSimd1发挥出了向量化应有的力量； optWithSimd2相较navie略快我们对

C++高级编程（57）SIMD指令与向量操作

m0_51768024的博客

03-16

1058

通过本篇博客的学习，我们应该能够理解SIMD指令的重要性以及如何在C++中进行向量操作。有效地使用SIMD指令和向量操作可以在不增加硬件复杂度的情况下显著提高程序的性能。在实际编程中，我们需要根据具体的需求和场景来选择最合适的方法和工具。随着技术的发展，我们期待有更多先进的工具和方法论来帮助我们更好地进行并行计算。如果您有任何疑问或想要进一步讨论，请随时在评论区留言。让我们继续探索C++的奥秘，共同提高我们的编程技能！

SIMD指令集大全

08-13

SIMD指令集大全，对于数据的cpu加速处理的优化指令集。包括MMX、SSE以及部分AVX的指令集，开发过程中可以参考。

SIMD指令集分析(C/C++)

AAAA202012的博客

04-06

1万+

阅读代码的时候遇到了__m128i、_mm_set1_epi8、_mm_loadu_si128、_mm_max_epu8、_mm_min_epu8、_mm_store_si128、_mm_unpackhi_epi8、_mm_adds_epi16、_mm_srli_si128等SIMD指令集，所以想着作一个总结。 0. SIMD基础知识 SIMD是单指令多数据技术，目前Intel处理器支持的SIMD技术包括MMX、SSE以及AVX。 MMX是MultiMedia eXtensions(多媒体扩展)的缩写，是

C++ 如何理解SIMD

Kp0fS的草稿纸

01-13

583

C++ 如何理解SIMD 这个是内存对齐的指令 SIMD，全称为单指令多数据流（Single Instruction, Multi

C++ SIMD

weixin_30538029的博客

04-08

124

SIMD Single Instruction Multiple Data 转载于:https://www.cnblogs.com/yangwenhuan/p/10673598.html

数值计算优化方法C/C++(三)——SIMD

artorias123的博客

04-25

1万+

C++数值计算简单加速技术(三)——SIMD 1、概述 SIMD全称Single Instruction Multiple Data，单指令多数据流，能够复制多个操作数，并把它们打包在大型寄存器的一组指令集。这个技术其实和GPU计算基本相似，就是几个执行部件同时访问内存，一次性获得所有操作数再进行运算，从而掩盖访存的时间开销，实现加速。因此只要能GPU并行的计算都可以通过SIMD优化，在CPU上获...

从编译到执行，C++如何开发SIMD友好的代码？

sinolover的专栏

03-02

1302

一：名词解释 Flynn分类法 Flynn于1972年提出了计算平台的Flynn分类法,主要根据指令流和数据流来分类。按照Flynn分类法，计算平台共分为四种类型。 1.单指令流单数据流机器(SISD) 2.单指令流多数据流机器(SIMD) 3.多指令流单数据流机器(MISD) 4.多指令流多数据流机器(MIMD) 标量处理器标量处理器是一...

c++ SIMD 样例

weixin_41644391的博客

02-01

3126

代码如下： #include <iostream> #include <x86intrin.h> #include <fstream> #include <chrono> using namespace std; struct StringView { const char* p; const size_t len; }; StringView FileSize(const char* fileName) { ifstream i

devc++中使用simd指令集

01-19

在DevC++中使用SIMD指令集需要进行以下步骤： 1. 确保你的处理器支持SIMD指令集。SIMD指令集是一种硬件特性，不是所有的处理器都支持。你可以查看你的处理器型号和规格，以确定是否支持SIMD指令集。 2. 在DevC++中，你需要使用适当的编译选项来启用SIMD指令集。具体的编译选项取决于你使用的编译器和编译器版本。你可以在编译器的文档中查找有关如何启用SIMD指令集的信息。 3. 在你的代码中，你可以使用SIMD指令集提供的函数和指令来进行向量化计算。这些函数和指令可以在SIMD指令集的文档中找到。你可以使用这些函数和指令来执行并行计算，从而提高程序的性能。下面是一个使用SIMD指令集进行向量加法的示例代码： ```c #include <stdio.h> #include <emmintrin.h> int main() { // 定义两个向量 __m128i vec1 = _mm_set_epi32(4, 3, 2, 1); __m128i vec2 = _mm_set_epi32(8, 7, 6, 5); // 执行向量加法 __m128i result = _mm_add_epi32(vec1, vec2); // 将结果打印出来 int* res = (int*)&result; printf("Result: %d %d %d %d\n", res[3], res[2], res[1], res[0]); return 0; } ``` 这段代码使用了SSE指令集中的`_mm_set_epi32`函数来创建两个向量，使用`_mm_add_epi32`函数执行向量加法，并使用`_mm_storeu_si128`函数将结果存储在一个整型数组中。最后，我们将结果打印出来。