list、set、map 之间的区别是什么?_SIMD vs SIMT vs SMT:并行处理模型之间有什么区别?...

6cf4b22d05da5fdf5b29d02d6a247882.png

现代处理器架构利用各种执行模型。其中,两个最受欢迎:SIMD(单指令多数据)和SIMT(单指令多线程)。还有SMT(同时多线程),但这是我们最后要检查的其他内容。在本文中,我们将了解SIMD和SIMT处理器的执行模式,并了解它们之间的区别。

SIMD:单指令多数据

3cb171a38b10a897b8eed8a1c7dd4781.png

马上,什么是SIMD,更重要的是它如何工作?SIMD是一种执行模型,这意味着处理器将其用于在管道中将相似的数据集排队并并行执行的方法。它是现代CPU和GPU使用的最受欢迎的EM之一。单指令多数据。顾名思义,它通过对多个数据集同时采用一条指令来工作。

这意味着:一条特定指令由多个执行单元对多个数据集执行。EU可以是ALU(算术逻辑单元)或FPU(浮点单元),但是这里的关键是它们都从共享的控制单元接收相同的指令,然后在多个不同的数据集上执行它。

fe243da02b9bbc6ca598be8234cd0f96.png

通过让CPU在不同的操作数上执行相同的任务,可以改善数据级的并行性(而不是指令级或并发性)。在上面的示例中,您可以看到代码行包含许多需要相同运算符的函数。在第一列中,所有四行基本上都涉及到两个不同矩阵的加法运算。SIMD允许在同一时钟周期内执行所有四个操作。这里要注意的一件事是SIMD使用执行单元,而不是线程或内核。

0df2e5b1658fb3d74828881b1f49aa01.png

SIMT:单指令多线程

SIMT是SIMD的线程等效项。后者使用执行单位或向量单位,而SIMT对其进行扩展以利用线程。在SIMT中,多个线程对不同的数据集执行相同的指令。SIMT的主要优点是它减少了指令预取带来的等待时间。

fc0bf4f549259becf451498283bf29e4.png

SIMT通常用于超标量处理器中以实现SIMD。因此,从技术上讲,每个内核本质上都是标量的,但是通过利用多个线程对各种数据集执行相同的任务,它仍然类似于SIMD模型。

每当GPU需要执行特定指令时,都会从内存中获取数据和指令,然后对其进行解码和执行。在这种情况下,需要使用同一条指令执行的所有数据集(达到一定限制)将使用处理器可用的各种线程同时预取并同时执行。

SMT:同步多线程

SMT或同时多线程允许CPU内核一次利用多个线程。尽管从理论上讲,通过SMT每个内核最多可以有8个线程,但是只有两个线程是可行的。SMT类似于在机场将两个货物安全带分类为行李,然后由一个人对其进行分类。

ce3f9246d820fa8e46f3998037ed3b32.png

有时候,一条皮带是空的,而另一皮带仍然有待处理的工作。在这种情况下,此人将切换到另一个皮带并继续分类,直到第一个皮带拿到更多行李。这类似于SMT在CPU中的操作方式。有时会出现内存延迟或高速缓存未命中的情况,此时,CPU内核通常会保持空闲状态。SMT旨在利用此优势来完全饱和CPU时间。

需要在内部修改CPU内核体系结构以支持SMT。这通常涉及增加寄存器大小(在某些情况下还包括高速缓存大小),以允许在两个线程之间平均分配资源,并防止争用。

尽管现代CPU很好地利用了SMT,但仍有很多时候需要冗余。那主要是在延迟密集型任务中,流水线几乎没有延迟。SMT甚至会影响资源密集型应用程序(注册和缓存)的性能。在这里,两个线程被迫相互竞争资源,从而导致性能下降。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
【问题描述】 封装一个模板数组类Array,支持以下操作: 1. 构造函数Array(int n),将数组初始化为n个存储空间,建议使用vector; 2. 函数input(int n),使用插入运算符<<读取数据,最多读取n个元素,但不能超过数组存储空间的上限; 3. 重载下标运算符,返回数组的元素。 封装一个分数类Fract,用来处理分数功能和运算,能支持你的Array类使用。 1. 构造:传入两个参数n和m,表示n/m;分数在构造时立即转化成最简分数。 提示:分数化简有专门的算法,可自行调研 2. show()函数:分数输出为“a/b”或“-a/b”的形式,a、b都是无符号整数。若a为0或b为1,只输出符号和分子,不输出“/”和分母。 3. 在分数类上重载+=运算符,进行分数的加法运算。 【输入形式】 输入为两部分,分别是一组实数测试样例和一组分数测试样例。 这两组测试样例都以正整数n,且n小于1000,n表示需要输入n个实数(或分数)。 测试样例的第二行开始为n个实数(或分数)。其中每个分数输入为两个整数n、m,表示分数n/m。 【输出形式】 第一部分输出一个实数,是第一组测试样例之和;第二部分输出一个分数,是第二组测试样例之和。 分数输出时为最简形式,负号只会出现在最前面,若分母为1或分子为0,则只输出一个整数,即分子部分,而没有“/”和分母部分。 【样例输入】 4 6 8 7 5 9 1 3 20 -15 80 150 -9 1 6 6 12 16 -33 -48 6 11 0 -10 【样例输出】 26 -17117/2640 25.00 下载源文件 得分25.00 最后一次提交时间:2021-06-08 21:49:12 共有测试数据:5 平均占用内存:1.415K 平均运行时间:0.00648S 测试数据 评判结果 测试数据1 完全正确 测试数据2 完全正确 测试数据3 完全正确 测试数据4 完全正确 测试数据5 完全正确 详细 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值