计算机术语中英文对照表（流水线/微架构/体系结构/指令集）

最新推荐文章于 2022-04-05 17:06:04 发布

一凡stkeke

最新推荐文章于 2022-04-05 17:06:04 发布

阅读量7.7k

点赞数 10

分类专栏： Intel微架构 CPU架构与优化文章标签：计算机术语计算机架构流水线性能优化处理器

本文链接：https://blog.csdn.net/qq_43401808/article/details/85228323

版权

Intel微架构同时被 2 个专栏收录

101 篇文章

订阅专栏

CPU架构与优化

74 篇文章

订阅专栏

本文深入解析了Intel Architecture(IA)架构中的关键术语，涵盖了从指令预取、流水线执行到缓存一致性等处理器核心概念。通过详细的描述，帮助读者理解IA架构下处理器的工作原理，包括动态执行、乱序执行、超标量处理以及缓存层次结构。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

术语	翻译	描述
Intel Architecture (IA)	IA架构	执行x86指令集的CPU架构
Pipeline	流水线	根据上下文，翻译做“流水线”或者“管道”
Pipelined	流水线化的
Instruction pipeline	指令流水线
5-stage pipeline	5级流水线
Stage	阶段，或级	根据上下文和中文习惯翻译
Call site	调用点	调用者函数中调用某个函数的语句位置
Pipeline stall	流水线停顿
Pipeline delay	流水线迟滞	几乎等同于“流水线停顿”
Pipeline hazard	流水线冲突
Dynamic execution	动态执行
Dynamic prediction	动态分支预测
Static prediction	静态分支预测
Dynamic predictor	动态预测器
Static predictor	静态预测器
In-order	有序
Out of Order (OOO)	乱序
Superscalar	超标量
Processor core	处理器核	通常指处理器中执行指令操作的各单元的集合，从指令预取开始，到退役单元结束。
Execution core	执行核	通常指流水线中的乱序执行相关的单元，包括预约站，执行单元等
OOO engine	乱序引擎	包括重命名器，预约站，和执行核
Execution Unit (EU)	执行单元	执行指令的硬件逻辑，例如整型ALU或浮点单元等
Execution stack	执行单元栈，或者执行栈	同一个发射端口下的某几个执行单元可以构成执行单元栈
Execution cluster	执行栈簇	同一个发射端口下的多个执行单元栈构成一个执行栈簇
Bypass delay	旁路延迟	一个执行栈生产的数据发往另一个执行栈消费使用，中间所耗费的时钟周期周期数
Bypass network	旁路网路	旁路网路用于将一条微指令的计算结果转发给另一条微指令做源操作数。转发过程的延迟即旁路延迟
Bank	存储体	构成存储器的部件
Memory	存储器	包括RAM和ROM
Main memory	主存	指计算机中的内部存储器，俗称内存
Branch prediction	分支预测
(Branch) resolve	分支决断	确定分支指令的采纳路径，即走向
Taken branch	采纳分支	分支条件决断后，被执行的分支
Not-taken branch	未采纳分支	分支条件决断后，未被执行的分支
Branch history table	分支历史表	与BTB一起进行分支预测
Previously-encountered branch	前见分支指令	以前遇到过的分支指令
Backward branch	回跳，或后向分支
Forward branch	前跳，或前跳分支
Forward-not-taken	前跳不采纳	静态预测机制将前向跳转预测为不采纳
Backward-taken	后跳采纳	静态预测机制将后向跳转预测为采纳
Direct jump	直接跳转
Indirect jump	间接跳转
Fall-through branch	落空分支	紧跟着分支指令的分支
Near branch	近分支	即落空分支
Far branch	远分支	即else分支
Near jump	近跳转
Far jump	远跳转
Near Branch	近跳转分支
Branch Target Buffer(BTB)	分支目标缓存区
Branch delay	分支延迟	分支预测失败导致的性能损失，通常以延迟的时钟周期数计算
Register Renaming	寄存器重命名，或寄存器更名
Register name space	寄存器名字空间	所有可用的寄存器名称集合
Interleaving	交错
macroinstruction	x86指令
microinstruction	微指令，或uOp
Speculative execution	投机执行
Issue	发射
Issue port	发射口	分发微指令的端口
Dispatch	分发，或派发
Dispatch port	发射口	即issue port
Load operation	加载，或者读存操作
Store operation	存储，或者写存操作
Dependency chain	依赖链	各指令间的依赖关系，用于分析可以乱序执行的指令
Critical path	关键路径
Renamer	重命名器	执行核中的一个主要部件
Read-after-read hazard	读后读冲突
Write-after-read hazard	读后写冲突
False dependency	假依赖	由于寄存器名字空间太小，即数量太少，造成的指令间寄存器依赖，可以通过重命名机制消除
Instructions per cycle(IPC)	每周期指令数	每个周期内处理器可以执行完毕并退役的指令数量
Outstanding load miss	读操作缓存未中	当缓存未中时，需要从存储器中读取数据，在等待数据期间，这个未中的请求叫做outstanding miss。
Store forwarding	存储转发	对于同一地址的先存储后读取，可以直接将存储数据转发到读取指令，无需等待数据写入存储器后再读取
Store-to-load forwarding	存储读取转发	即存储转发
Cache line	缓存行
Cache hierarchy	缓存层级
Inclusive cache	包含式缓存	第i级缓存中的缓存行也存在于第i+1级缓存中
Non-inclusive cache	非包含式缓存	第i级缓存中的缓存行*并不一定*存在于第i+1级缓存中
Access	访问	即可以是存操作，也可以是取操作
Coherency	缓存一致性	确保设备(不仅仅是CPU)不会获取过时的数据
Coherency protocol	缓存一致性协议	用于保障缓存一致性的机制
Snoop	缓存嗅探
Dual-ported	双端口	即有两个端口，可以同时操作
Short latency	低延迟，或短延迟
Long latency	高延迟，或长延迟
Clock	时钟周期	同cycle
Cycle	时钟周期	同clock
Processor clock speed	处理器频率	例如运行在1.5GHz频率上的处理器
Bus clock speed	总线频率	例如运行在100MHz频率上的总线
Bus congestion	总线拥塞	多个事务同时请求总线，导致总线繁忙，响应延迟
Processor cycle	处理器周期
Bus cycle	总线周期
Bus ratio	总线比	处理器频率与总线频率的比值，由于处理器的频率通常更高，所以这个值通常大于1
Pipeline	流水线
Pipelined	流水线化
Functional block diagram	功能框图
(external) system bus	(外部)系统总线	即地址总线/数据总线/控制总线的合称
Cache bus	高速缓存总线	不引起歧义的情况下，简称为缓存总线
Internal bus	内部总线	CPU内部的总线
L2 Cache	二级高速缓存	不引起歧义的情况下，简称为二级缓存
Unified L2 Cache	二级混合缓存	既可以保存指令，又可以保存数据的缓存
Shared L2 Cache	二级共享缓存	在多个处理器核之间共享的高速缓存
L1 Data Cache (L1D)	一级高速数据缓存	不引起歧义的情况下，简称为数据缓存
L1 Instruction Cache (L1I)	一级高速指令缓存	不引起歧义的情况下，简称为指令缓存
L1 Code Cache	一级高速指令缓存	同L1 Instruction Cache，不引起歧义的情况下，简称为指令缓存
Data prefetcher	数据预取器
Data prefetch logic	数据预取逻辑	处理器中的数据预取硬件
Cache miss	缓存未命中，缓存未中
Cache hit	缓存命中
Modified	修改状态	MESI缓存一致性协议中的状态
Exclusive	独占状态	MESI缓存一致性协议中的状态
Shared	共享状态	MESI缓存一致性协议中的状态
Invalidate	无效状态	MESI缓存一致性协议中的状态
Initiating core	发起核	在多核系统中，执行访存指令的处理器核
4-way	4路
Set associative	组相联，或组关联
Self-modified code	自修改代码
Memory interface unit	内存接口单元	负责计算指令访存时的有效地址。注意不是BIU，不负责内存读写操作
Memory order buffer (MOB)	内存访问排序缓存区	注意不是Reorder Buffer
Scheduling	调度
Fetch	取指
Prefetch	指令预取
Instruction Prefetch Unit	指令预取单元
Fetch line	指令行	每次IFU读取的16字节指令行
Instruction line	指令行	即fetch line
Misaligned target	未对齐分支目标	没有按照16字节对齐的分支目标
Decode	译码
(Instruction) Decoder	(指令)译码器
Instruction predecoder	指令预译码器
Predecoder unit	指令预译码单元	即指令预译码器
Simple-instruction decoder	简单指令译码器	简称为简单译码器
Complex-instruction decoder	复杂指令译码器	简称为复杂译码器
Main decoder	主译码器	即复杂译码器
Instruction length decoder	指令长度译码器	标记指令流中每条x86指令的边界
Instruction queue	指令队列	保存以标记长度的x86指令队列
Instruction decoder queue(IDQ)	译码后微指令队列	注：这个术语没有按英文字面意思“指令译码器队列”翻译。
Decoded ICache	译码后微指令高速缓存	存在于Sandy Bridge微架构；等价于Nehalem微架构中IDQ
Scalar SIMD instruction	标量SIMD指令
Scalar SIMD operation	标量SIMD操作
Packed SIMD instruction	组合SIMD指令
Packed SIMD operation	组合SIMD指令
Microcode Instruction sequencer	微指令序列生成器	译码复杂的4微指令以上的x86指令，即x86指令译码后对应4条以上的微指令
microsequencer	微指令序列器，或微序列器	即微指令序列生成器
Forward data stream	前向数据流
Backward data stream	后向数据流
Microcode ROM	微码ROM	Pentium 4处理器上用于译码超过4微指令的x86指令的“译码器”
Micro-op, uop	微指令
Triadic micro-op	三操作数微指令
Trace cache	跟踪片高速缓存	Pentium 4上的“指令池”
Execution Trace Cache	执行跟踪片缓存	Trace Cache的全称
Register alias table	寄存器别名表
Instruction pool	微指令池
Reorder buffer	(微指令)排序缓存区	不同于memory order buffer
Instructions in flight In-flight instruction	进行中指令	执行核中所有处在执行状态（包括执行完毕尚未退役）的微指令
Reservation station	(执行)资源分配站	用于为微指令分配执行资源
Integer unit	整型单元	执行整型指令
Floating-point unit	浮点单元	执行浮点指令
Address generation unit (AGU）	地址计算单元	指令访存时，用于生成有效地址
Retire Unit	退役单元	按照程序设计顺序更新处理器架构状态，退役指令
Retirement register file	退役寄存器堆	Todo：如何翻译
Register file	寄存器堆	所有寄存器的合称
Transaction-oriented bus	事务型总线	每次总线访问都是独立请求与响应成对操作
Request	请求
Response	响应
Close-coupled	紧耦合的
Source operand	源操作数
Destination operand	目的操作数
Addressing mode	寻址方式
Immediate operand	立即数
Immediate addressing	立即寻址
Register operand	寄存器操作数
Register addressing	寄存器寻址
Memory operand	存储器操作数
Memory addressing	存储器寻址
Register indirect addressing	寄存器间接寻址
Index addressing	变址寻址
Based addressing	基址寻址
Based index addressing	基址变址寻址	有时简称为“基变寻址”
Displacement	位移量
Offset	偏移量
Logical address	逻辑地址	即汇编程序员看到的地址：段基：段偏移
Physical address	物理地址	送到地址总线上用于寻址存储器的地址
Linear address	线性地址	当开启分页机制后，线性地址空间中的地址
Virtual address	虚拟地址	本文尽量不用这个术语
Effective address (EA)	有效地址	即操作数相对于段基的偏移量
Large-register	大寄存器	比小寄存器宽（即位数更多）的寄存器或者全寄存器。例如32位模式下，相对于AH/AL，AX，EAX都是大寄存器。
Full-register	全寄存器	即完整的寄存器，例如16位模式下的AX，32位模式下的EAX，64位模式下的RAX等。
Small-register	小寄存器	即某个全寄存器的子寄存器，例如相对于EAX，小寄存器包括AL，AH，AX。
Partial register	局部寄存器	相对于全寄存器，所有的子寄存器的统称，例如EAX的小寄存器包括AL，AH，AX。
Address Generation Interlock	地址生成互锁	指令之间产生依赖的情形，会导致流水线停顿
Partial stall condition	(寄存器)局部更新停顿条件	即先写入小寄存器，然后立即使用大寄存器，则产生流水线停顿。
NP (Not Pairable)	不可配对执行	Pentium处理器的指令配对执行，只能在流水线U中执行
PU (Pairable if issued to U-Pipe)	入U可配对	Pentium处理器的指令配对执行，如果执行被发射入流水线U中，则可以和其他指令配对执行
PV (Pairable if issued to V-pipe)	入V可配对	Pentium处理器的指令配对执行，如果执行被发射入流水线V中，则可以和其他指令配对执行
UV (pairable in either pipe)	任意配对	Pentium处理器的指令配对执行，入任一流水线U或V中，皆可与其他指令配对执行
Architectural state	处理器架构状态	即程序员可见的IA32寄存器以及处理器状态
Architected path	架构路径	在投机执行中，处理器最终执行完毕的路径
Non-architected path	非架构路径	在投机执行中，处理器投机执行的但是最终废弃的路径，可能由于分支预测失败导致。
Operand-size prefix	操作数宽度前缀	指令前缀0x66，用于切换操作数宽度
Address-size prefix	地址宽度前缀	指令前缀0x67，用于切换地址宽度
Length changing prefix (LCP)	(指令)长度切换前缀	即操作数宽度前缀和地址宽度前缀的合称
Return address stack	返回地址栈	用于预测过程的返回地址
Return stack buffer	返回栈缓存区	即返回地址栈
Return stack	返回栈	即返回地址栈，为避免歧义，汉语版不使用这个术语。Intel的文档有时候混用这两个术语，其实是指同一个事物。
Loop unrolling	循环展开	小的循环迭代次数，直接展开成多个顺序指令
Loop stream detector	循环流侦测器	用于侦测指令流中的符合条件的循环结构
Architected code path	架构代码路径	程序中的路径，该路径上的指令最终会执行完毕并退役
Non-architected code path	非架构代码路径	程序中的路径，该路径上的指令可能由于分支预测错误导致乱序执行核投机执行，但是最终不会执行完毕并退役，而是被废弃
Macro-fusion	宏融合	相邻的多条x86指令组合在一起生成单条微指令
Micro-fusion	微融合	多条微指令融合一起生成单条微指令
Non-temporal store	非时效存储	直接将数据写入内存，不对缓存进行操作
Streaming store	流式存储	等价于非时效存储，互相交换使用
Non-temporal load	非时效读取	按照提示将数据读入到某级缓存中
Non-temporal prefetch	非时效预取	按照提示将数据读入到某级缓存中
Temporal store	实效存储	即正常的数据写操作
Temporal load	实效读取	即正常的数据读操作
Temporal data	实效数据	短期内即将可能被使用的数据
Non-temporal data	非时效数据	短期内不大可能被使用的数据
Intel Smart Cache	Intel智能缓存	Intel Core Solo/Duo处理器上的高速缓存
Load buffer	Load缓冲区	为load操作分配的缓冲区
Store buffer	Store缓冲区	为store操作分配的缓冲区
Read-for-ownership	属主读请求	为成为缓存行的属主发起的读缓存行请求
Wide Dynamic Execution	宽动态执行	Core微架构
Advanced Smart Cache	先进智能缓存
Smart Memory Access	智能存储器访问
Advanced Digital Media Boost	先进数字媒体加速
High performance	高性能模式，或高能模式	处理器运行在最大性能模式
Power-efficient performance	能效性能模式	处理器运行在兼顾能耗与性能的模式
Induction variable	归纳变量	循环中的循环变量，或者另一个归纳变量的线性函数
Profile-guided optimization (PGO)	性能剖析知道的优化	Intel C++编译器提供的一种优化方法
Processor die	处理器基模
On-die	片上	技术准确地说，应该是基模上
Off-die	片外	技术准确地说，应该是基模外
Uncore	核外	处理器核之外的子系统集合
Memory flavor	(指令)存储器操作格式	指令操作存储器的格式
Register flavor	(指令)寄存器操作格式	指令操作寄存器的格式
Bit-toggle	比特反转	当处理器指令执行时，需要不断的反转三极管代表的比特位，主要是消耗电力
Uncacheable memory	非缓存存储类型	这种类型的数据读取或写入时不会保存在高速缓存中
Writeback memory	回写存储类型	这种类型的数据读取时也会在高速缓存中保留一个拷贝，以便后续快速访问