英特尔的指令集体系结构_INTEL 体系结构 MMX™ 技术开发者手册

本文档详细介绍了英特尔的MMX技术,包括处理器体系结构、流水线和高速缓存的工作原理,以及如何开发高效MMX代码。章节涵盖了MMX代码开发规则、调度、内存优化策略,以及编码技术,旨在帮助开发者充分利用MMX技术提升性能。
摘要由CSDN通过智能技术生成

目录

第一章 手册简介

1.1  关于本手册

1.2  参考文献

第二章 处理器体系结构和流水线简介

2.1  超标量(奔腾系列)的流水线和动态执行(P6系列)体系结构

2.1.1   超标量(奔腾系列)的流水线

2.1.2   动态执行(P6系列)流水线

2.2  高速缓存(Cache)

2.3  分支目标缓存

2.3.1   相连分支

2.4 写缓存Cache

第三章 MMX™代码开发规则

3.1.  规则列表及建议

3.1.1   规则

3.1.2   建议

3.2  常规的优化方案

3.2.1   寻址方式

3.2.2   对齐

3.2.2.1    代码

3.2.2.2    数据

3.2.3   有前缀的操作码

3.2.4   动态执行(P6系列)处理器中的部分寄存器阻塞

3.2.5   有关分支预测的信息

3.2.5.1    动态分支预测

3.2.5.2    在动态执行(P6系列)处理器上的静态预测

3.3  调度

3.3.1   通用配对规则

3.3.2   整数配对规则

3.3.2.1    配对指令集

3.3.2.2    由于寄存器相关而不能配对的指令

3.3.2.3    特定配对

3.3.2.4    配对执行的限制

3.3.3   MMX™指令配对准则

3.3.3.1    两个MMX™指令的配对

3.3.3.2    U管道的整数指令与V管道中的MMX™指令配对

3.3.3.3    U管道的MMX™指令与V管道中的整数指令配对

3.3.3.4    调度规则

3.4  指令选择

3.4.1   使用访问内存的指令

3.4.2   指令长度

3.5  高速缓存优化

3.5.1   线读入顺序(命令)

3.5.2   在高速缓存线中的数据对齐

3.5.3   与分配效果

3.5.3.1    优化方法1: 布尔

3.5.3.2    优化方法2: 写前检查

3.6  内存优化

3.6.1   对部分内部访问

3.6.2   增加内存填充和视频填充的带宽

3.6.2.1    内存填充

3.6.2.2    视频填充

第四章 MMX™代码开发策略

4.1  制订计划

4.2  哪部分代码可使用MMX™技术改进

4.3  代码是浮点型还是整型

4.3.1   混用浮点和MMX™代码

4.4  EMMS准则

4.5  CPUID的检测MMX™技术的用法

4.6  数据对齐

4.6.1   堆栈对齐

4.7  数据安排

4.8  应用程序最后的调节

第五章 MMX™的编码技术

5.1  无符号分组

5.2  有符号分组

5.3  饱和模式下的交错成组

5.4  非饱和模式下的交错成组

5.5  非交错分组

5.6  含有一个常数的复数乘法

5.7  无符号数差值的绝对值

5.8  有符号数差值的绝对值

5.9  绝对值

5.10  有符号数截取到任意有符号区域[HIGH,LOW]

5.11  无符号数截取到任意无符号区域[HIGH,LOW]

5.12  常数生成

第六章 MMX™性能监测扩展

6.1  超标量(奔腾系列)性能监测事件

6.1.1   MMX™指令事件说明

6.2  动态执行(P6系列)性能监测事件

6.3  RDPMC指令

6.3.1   指令规则

附录A MMX™指令集

附录B MMX™命令和操作数限制

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值