IEEE浮点标准

  原文地址:http://www.math.byu.edu/~schow/work/IEEEFloatingPoint.htm

 

Floating point system

Floating point arithmetic

 

  浮点型标准是什么?

  IEEE浮点标准是上世纪80年代初由IEEE采用的一个浮点计算系统。

  计算机采用IEEE浮点标准的要求:

  1.正确计算舍入;

  2.浮点数应该被计算机正确表示;

  3.异常处理应该是明确一致的。

  引用:见顶部

 

  浮点数表示法

  32位机的单精度数:

  32位机的单精度模式会将一个字表示为b1b2b3...b9b10b11...b32的实数形式

                                  (-1)s x 2e-127 x (1.f)2

   where s = b1,  e = (b2...b9)2, and f = b10b11...b32.  

                              

符号位偏移指数正常数字尾部的分数
1 bit8 bits23 bits
sef

   需要注意的是,尾部的分数部分由一个隐藏位和实际尾部数字共24位二进制数存储。  

 

  32位的双精度数

  32位机的双精度模式会将两个字表示为b1b2b3...b12b13b14...b64 的实数形式

                                   (-1)s x 2e-1023 x (1.f)2

  where s = b1,  e = (b2...b12)2, and f = b13b14...b64

符号位偏移指数尾部的小数
1 bit11 bits52 bits
sef

  尾部的分数部分由一个隐藏位和实际尾部数字共53位二进制数存储。

  

  32位机浮点数的十进制值:

 单精度双精度
Machine epsilon2-23 or 1.192 x 10-7  2-52 or 2.220 x 10-16
最小正数2-126 or 1.175 x 10-38 2-1022 or 2.225 x 10-308 
最大正数(2- 2-23) 2127 or 3.403 x 1038 (2- 2-52) 21023 or 1.798 x 10308 
最小负数2-150 or 7.0 x 10-462-1075 or 2.5 x 10-324
十进制精度6 位标识15 位标识

        (Machine epsilon:大于1的机器所能表示的最小浮点数;Smallest subnormal:低于最小值?无穷小?)    

        (In computer science, denormal numbers or denormalized numbers (now often called subnormal numbers) fill the underflow gap around zero in floating-point arithmetic. Any non-zero number with magnitude smaller than the smallest normal number is 'subnormal'.)

  IEEE标准舍入

  通常使用舍入到最近值的方式。基本上,给定一个实数x,它正确的舍入值是最接近x的浮点数fl(x)。

  

  IEEE浮点标准的特殊值

  单精度表示

 标志位指数偏移小数部分
 

1 bit

8 bits

23 bits

7/400 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 
-34.43217511 0 0 0 0 1 0 0 0 0 0 1 0 0 1 1 0 1 1 1 0 1 0 1 0 0 0 1 1 0 0
-9598181 0 0 1 0 0 1 0  1 1 0 1 0 1 0 0 1 0 1 0 1 0 0 1 0 1 0 0 0 0 0
+ 000 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
- 010 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
macheps00 1 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
"smallest"00 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
"largest"01 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
infinity01 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
NaN01 1 1 1 1 1 1 1Not all 0s or 1s
2-128**00 0 0 0 0 0 0 00 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

    (macheps = machine epsilon,infinity:无穷大)

  **这些是非标准数。这些数计算机可以表示,但是相比于正常值,它们的精度要低一些。

转载于:https://www.cnblogs.com/saaav/p/4116216.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值