FPU , MMX SSE

最新推荐文章于 2024-07-08 14:55:00 发布

shybrian

最新推荐文章于 2024-07-08 14:55:00 发布

阅读量1.4k

点赞数

分类专栏：计算机体系结构文章标签：汇编 yahoo 体育 gcc 优化

计算机体系结构专栏收录该内容

3 篇文章 0 订阅

订阅专栏

为什么要需要FPU和MMX/SSE？
提供了SIMD环境（single instruction multi data），即单指令多数据。
内嵌浮点运算单元，64及128位寄存器等。甚至sin/cos等数学函数也囊括其中，
著名的xvid项目就是使用gcc编译后使用MMX/SSE优化汇编的典型案例。

转载请注明原创：http://www.cppblog.com/jinglexy
msn and mail: jinglexy at yahoo dot com dot cn 上海体育馆2007.4.18

FPU: 8个80位浮点寄存器（数据），16位状态寄存器，16位控制寄存器，16为标识寄存器。
     使用FPU指令对这些寄存器进行操作，这些寄存器构成一个循环栈，st7栈底，st0栈顶，
     当一个值被压入时，被存入st0，原来st0中的值被存入st7
MMX: 将8个FPU寄存器重命名为8个64位MMX寄存器，即mm0到mm7。
     57条MMX指令，加快了整形浮点运算，但是对于复杂浮点运算无帮助

SSE: 8个128位寄存器（从xmm0到xmm7），MXSCR寄存器，EFLAGS寄存器，专有指令（复杂浮点运算）
SSE2: 寄存器和SSE相同，增加了5种数据类型（都是128位），专有指令
SSE3: 仅增加了几个新的指令

由于MMX使用的寄存器影射到FPU寄存器上，所以MMX指令执行前，需要保存FPU堆栈。

示例1，FPU寄存器及指令使用（下面所有程序都使用at&t风格汇编）：
data1:
        .byte 0x34, 0x12, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00
data2:
        .byte 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00
.section .text
.globl _start
_start:
        nop
        fbld data1     压入st0
        fimul data2     st0中的值和data2相乘，保存在st0中
        fbstp data1     st0弹出到内存44

示例2, SSE寄存器及指令使用
.lcomm data 16
value1:
        .float 12.34, 2345.543, -3493.2, 0.44901
value2:
        .float -54439.234, 23231.4, 1.0098, 0.000003
.section .text
.globl _start
_start:
        movups value1, %xmm0
        movups value2, %xmm1
        movups %xmm0, %xmm2
        movups %xmm0, data

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
FPU , MMX SSE

为什么要需要FPU和MMX/SSE？提供了SIMD环境（single instruction multi data），即单指令多数据。内嵌浮点运算单元，64及128位寄存器等。甚至sin/cos等数学函数也囊括其中，著名的xvid项目就是使用gcc编译后使用MMX/SSE优化汇编的典型案例。转载请注明原创：http://www.cppblog.com/jinglexymsn
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。