IEEE Floating Point Standard (IEEE754浮点数表示法标准)

浮点数与定点数表示法是我们在计算机中常用的表示方法 所以必须要弄懂原理,特别是在FPGA里面,由于FPGA不能像在MCU一样直接用乘除法。

定点数

首先说一下简单的定点数,定点数是克服整数表示法不能表示实数的缺陷,那么我们就可以通过将实数乘上一个分数来实现,当然要是分数就是2^-i倍数,那么我们的定点数表示法就是精确的表示,但是很不幸我们自然界中的树并不是那么凑巧。所以定点数只能是近视表示实数,包括浮点法也是这样的。具体的实现就是将表示成2进制后,然后在左移k位,那么对于N为的定点数表示法中,就有N-1-K表示整数部分,低k位表示分数,最高位表示符号。

定点数表达法的缺点在于其形式过于僵硬,固定的小数点位置决定了固定位数的整数部分和小数部分,不利于同时表达特别大的数或者特别小的数。

浮点数

浮点数表示法更为复杂, 这种表达方式利用科学计数法来表达实数,即用一个尾数(Mantissa ),一个基数(Base),一个指数(Exponent)以及一个表示正负的符号来表达实数。比如 123.45 用十进制科学计数法可以表达为 1.2345 × 102 ,其中 1.2345 为尾数,10 为基数,2 为指数。浮点数利用指数达到了浮动小数点的效果,从而可以灵活地表达更大范围的实数。
提示: 尾数有时也称为有效数字(Significand)。尾数实际上是有效数字的非正式说法。
在 IEEE 标准中,浮点数是将特定长度的连续字节的所有二进制位分割为特定宽度的符号域,指数域和尾数域三个域,其中保存的值分别用于表示给定二进制浮点数中的符号,指数和尾数。这样,通过尾数和可以调节的指数(所以称为"浮点")就可以表达给定的数值了。具体的格式参见下面的图例:


上图中可以看出S表示符号位,EXponent表示指数位,也就是“浮动”的指数位,指数的范围在32位的系统中(0-2^8 -1)/2 也就是0-127,在double型位2^11位浮动指数。

指数域中,对应于我们之前介绍的二进制科学计数法中的指数部分。其中单精度数为 8 位,双精度数为 11 位。以单精度数为例,8 位的指数为可以表达 0 到 255 之间的 255 个指数值。但是,指数可以为正数,也可以为负数。为了处理负指数的情况,实际的指数值按要求需要加上一个偏差(Bias)值作为保存在指数域中的值,单精度数的偏差值为 127,而双精度数的偏差值为 1023。比如,单精度的实际指数值 0 在指数域中将保存为 127;而保存在指数域中的 64 则表示实际的指数值 -63。 偏差的引入使得对于单精度数,实际可以表达的指数值的范围就变成 -127 到 128 之间(包含两端)。我们不久还将看到,实际的指数值 -127(保存为 全 0)以及 +128(保存为全 1)保留用作特殊值的处理。这样,实际可以表达的有效指数范围就在 -127 和 127 之间。在本文中,最小指数和最大指数分别用 emin 和 emax 来表达。

图例中的第三个域为尾数域,其中单精度数为 23 位长,双精度数为 52 位长。除了我们将要讲到的某些特殊值外,IEEE 标准要求浮点数必须是规范的。这意味着尾数的小数点左侧必须为 1,因此我们在保存尾数的时候,可以省略小数点前面这个 1,从而腾出一个二进制位来保存更多的尾数。这样我们实际上用 23 位长的尾数域表达了 24 位的尾数。比如对于单精度数而言,二进制的 1001.101(对应于十进制的 9.625)可以表达为 1.001101 × 23,所以实际保存在尾数域中的值为 00110100000000000000000,即去掉小数点左侧的 1,并用 0 在右侧补齐。


注:单精度浮点型所谓的7.2位精度就是指的是有效位的范围,因为单精度浮点可以表达的最大指数为 2^24 - 1 = 16,777,215这个数就是有效位的最大表示数字了,超过这个数的就要进行取舍。







参考:

http://www.cnblogs.com/cloudseawang/archive/2007/02/06/641652.html

IEEE 754 Floating-Point Format

IEEE 754 FLOATING POINT REPRESENTATION

  • 4
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: IEEE 754浮点数是一种可表示实数的标准格式,在计算机科学中被广泛使用。LabVIEW作为一种高级程序设计语言,也支持IEEE 754浮点数的转换。 在LabVIEW中,将浮点数转换为IEEE 754格式可以通过使用“Type Cast”或“Flatten to String”函数来实现。Type Cast函数可以将任何数据类型转换为另一个数据类型,而Flatten to String函数则将任何数据类型转换为字符串格式。 另外,在LabVIEW中还可以使用“IEEE Floating Point”面板对象来表示IEEE 754浮点数。这个对象有多种不同的显示格式,可以根据实际需要选择。 同时,也可以使用“Unflatten from String”函数将字符串格式的IEEE 754浮点数转换为实数。这个函数与“Flatten to String”函数相对应,可以将任何字符串转换为指定数据类型的数据。 总之,通过上述方法,在LabVIEW中可以方便地进行IEEE 754浮点数的转换和表示,方便实现各种复杂的计算任务。 ### 回答2: IEEE754浮点数是现代计算机系统中广泛使用的一种二进制数表示方法,用于表示实数。在LabVIEW中,通过使用数字数据类型的标签来指定浮点数据是单精度浮点数还是双精度浮点数。 为将浮点数转换为IEEE754浮点数,需要将浮点数的符号、阶码和尾数转换成对应的二进制格式。在单精度浮点数中,符号位占1位,阶码占8位,尾数占23位,而在双精度浮点数中,符号位占1位,阶码占11位,尾数占52位。在进行浮点数转换时,需要注意计算机中浮点数的字节序,以正确存储转换后的IEEE754浮点数。 为了在LabVIEW中完成浮点数转换,可以使用“单精度浮点数转换”或“双精度浮点数转换”函数。这些函数可以将浮点数转换为IEEE754浮点数,并将结果存储在指定的输出变量中。此外,在LabVIEW中也可以使用“数字到字符串”函数,将浮点数转换为字符串格式,方便输出或显示。 需要注意的是,由于浮点数的精度限制,在进行浮点数计算时可能会出现舍入误差,这些误差可能会影响计算结果的精度和准确性。因此,在LabVIEW中进行浮点数计算时,需要注意浮点精度问题,并尽可能采用正确的计算方法来避免误差积累的影响。 ### 回答3: IEEE 754浮点数是一种二进制数的表示方式,用于表示实数。这种表示方式包括三个部分:符号位、指数位和尾数位。 在LabVIEW中,可以使用Float to Hex和Hex to Float这两个函数进行IEEE 754浮点数的转换。Float to Hex函数将一个浮点数转换成其对应的16进制数,而Hex to Float函数将16进制数转换成对应的浮点数。 在进行转换时,需要注意保留位数的问题。IEEE 754浮点数中有单精度浮点数和双精度浮点数,其精度分别为32位(4字节)和64位(8字节)。在LabVIEW中,Float to Hex函数默认输出8位16进制数,而Hex to Float函数默认输入8位16进制数。如果需要更多的位数精度,可以在函数的属性中进行相应的设置。 除了转换函数外,LabVIEW中还提供了计算IEEE 754浮点数的函数,如Get Single Precision Float Info和Get Double Precision Float Info。这些函数可以获取浮点数的符号位、指数位和尾数位等信息,方便进行更复杂的运算。 总之,IEEE 754浮点数转换在LabVIEW中非常方便快捷。使用Float to Hex和Hex to Float这两个函数,可以轻松地完成浮点数的转换,而通过更复杂的函数,还可以进行精度更高的运算。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值