【2020/12/4修订】【梳理】计算机组成与设计 第3章 算术 第3节 数据级并行(docx)

本文介绍了计算机组成原理中关于算术的第三章重点——数据级并行,特别是向量化计算。讲解了ARM的NEON、Intel的MMX/SSE/AVX等向量化的指令集,以及如何利用C++实现向量化运算,通过DGEMM运算的例子展示了向量化的效率提升。同时,提到了浮点数加法不满足结合律,以及Intel Pentium处理器的浮点除法bug事件,强调了浮点精度问题的重要性。
摘要由CSDN通过智能技术生成

配套教材:
Computer Organization and Design: The Hardware / Software Interface (5th Edition)
这是专业必修课《计算机组成原理》的复习指引。建议将本复习指导与博客中的《简明操作系统原理》配合复习。
需要掌握的概念在文档中以蓝色标识,并用可读性更好的字体显示 Linux 命令和代码。代码部分语法高亮。
计算机组成原理不是语言课,本复习指导对用到的编程语言的语法的讲解也不会很细致。如果不知道代码中的一些关键字、指令或函数的具体用法,你应当自行查找相关资料。


第三章 算术

第一节 整数的四则运算

第二节 浮点

第三节 数据级并行

注意

链接:https://pan.baidu.com/s/1KqTIQs9qUwwrt3ov-qYNCw
提取码:0000


第三节 数据级并行
随着图形和音频的需求越来越强劲,CPU架构师们实现了数据级并行(data level parallelism,DLP),也称子字(亚字)并行(subword parallelism)。数据级并行在实际应用中一般说成更具体的方法,比如向量化(矢量化,vectorization)或者SIMD(single instruction multiple data,单指令多数据)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值