在许多应用程序领域中,都需要控制小数点后的小数位,但是浮点数对此不能提供直接的支持。怎样对程序中的浮点数据进行 "整齐 "地格式化呢?在此我们有一个迂回的方法,先把它们转换为字符串,格式化后以文本形式显示出来。
在日常编程中--包括对话框、关系数据库、金融程序、SMS程序及一切处理数据文件的程序,需要控制小数点后的小数位的情况非常普遍,本文中将要讲解如何用简单的方法来控制小数位,另外,还要揭开字符串及数据精度的一点点小秘密。
问题的引出
如有一个函数,其可接受一个long double参数,并将参数转换为字符串,结果字符串应保留两位小数,例如,浮点值123.45678应该生成 "123.45 "这样的字符串。表面上看来这是一个意义不大的编程问题,然而,如果真要在实际中派上用场,函数应设计为具有一定弹性,以允许调用者指定小数位数。另外,函数也应该能够处理各种异常情况,如像123.0或123这样的整数。
在开始之前,先看一下编写 "优雅 "C++代码时的两句 "真言 ":
"真言 "1:无论何时需要格式化一个数值,都应先转换为一个字符串。这样可保证每位数刚好占据一个字符。
"真言 "2:在需要转换为字符串时,请使用 <sstream> 库。
转换函数的接口非常简洁:第一个参数是需被格式化的数值;第二个参数代表小数点后显示的小数位,且应该具有一个默认值;返回值为一个string类型:
string do_fraction(long double value, int decplaces=3);
注意,第二个参数代表的小数位数中包括了小数点,因此,两位小数需要默认值为3。
精度问题
当然,第一步是把long double值转换为一个string,使用标准C++库 <sstream> 简直是手到擒来。然而,有一件事情必须引起注意,因为某些原因,stringstream对象默认精度为6,而许多程序员错误地把 "精度 "理解为小数的位数,这是不正确的,精度应指代全部位数。因而,数字1234.56可安全地通过默认精度6来表示,但12345.67会被截断为12345.6。这样的话,如果你有一个非常大的数,如1234567.8,它的结果会静悄悄地转换为科学记数法:1.23457e+06,这显然不是我们想要的。为避免这样的麻烦,在开始转换之前,应把默认精度设为最大。 ( 见 http://msdn.microsoft.com/en-us/library/af6x78h6(v=vs.80).aspx )
为得到long double能表示的最大位数,可使用 <limits> 库:
string do_fraction(long double value, int decplaces=3)
{
int prec=numeric_limits <long double> ::digits10; //
ostringstream out;
out.precision(prec);//覆盖默认精度
out < <value;
string str= out.str(); //从流中取出字符串 数值现在存储在str中,等待格式化。
小数点的位置
要进行格式化,首先要确定小数点的位置,如果小数位多于decplaces,do_fraction()会删除多余的。
要定位小数位,可使用string::find(),在STL算法中使用了一个常量来代表 "数值未找到 ",在字符串中,这个常量为string::npos:
char DECIMAL_POINT= '. '; // 欧洲用法为 ', '
size_t n=str.find(DECIMAL_POINT);
if ((n!=string::npos)//是否有小数点呢?
{
//检查小数的位数
}
如果没有小数点,函数直接返回字符串,否则,函数将继续检查小数位是否多于decplaces。如果是,小数部分将会被截断:
size_t n=str.find(DECIMAL_POINT);
if ((n!=string::npos)//有小数点吗?
&&(str.size()> n+decplaces)) //后面至少还有decplaces位吗?
//在小数decplaces位之后写入nul
str[n+decplaces]= '/0 ';
最后一行覆盖了多余的小数位,它使用了/0常量来截断字符串,要注意,string对象的数据可以包含nul字符;而字符串的实际长度由size()的返回值决定。因此,你不能假定字符串已被正确地格式化,换句话来说,如果在str中原来为 "123.4567 ",在插入/0常量之后,它变成了 "123.45/07 ",为把str缩减为 "123.45 ",一般可使用自交换的方法: str.swap(string(str.c_str()) );//删除nul之后的多余字符
那它的原理是什么呢?函数string::c_str()返回一个const char *代表此字符串对象,而这个值被用作一个临时string对象的初始化值,接着,临时对象又被用作str.swap()的参数,swap()会把值 "123.45 "赋给str。一些老一点的编译器不支持默认模板参数,可能不会让swap()通过编译,如果是这样的话,使用手工交换来代替:
string temp=str.c_str();
str=temp;
代码虽不是很 "优美 ",但能达到目的就行。以下是do_fraction()的完整代码:
string do_fraction(long double value, int decplaces=3)
{
ostringstream out;
int prec=
numeric_limits <long double> ::digits10; // 18
out.precision(prec);//覆盖默认精度
out < <value;
string str= out.str(); //从流中取出字符串
size_t n=str.find(DECIMAL_POINT);
if ((n!=string::npos) //有小数点吗?
&& (str.size()> n+decplaces)) //后面至少还有decplaces位吗?
{
str[n+decplaces]= '/0 ';//覆盖第一个多余的数
}
str.swap(string(str.c_str()));//删除nul之后的多余字符
return str;
}
如果不想通过传值返回一个string对象,还可增加一个参数,把str对象以传递:
void do_fraction(long double value, string & str, int decplaces=3);
从个人的角度来讲,还是倾向于让编译器做这样的优化,另外,使用传值返回,还可以让你以下面这种方式使用do_fraction():
cout < < funct(123456789.69999001) < < '/t ' < < funct(12.011) < <endl;
输出:
123456789.69 12.01
-----------------------------------------------------------------------------------------
IEEE 浮点数格式:
从存储结构和算法上来讲,double和float是一样的,不一样的地方仅仅是float是32位的,double是64位的,所以double能存储更高的精度。
任何数据在内存中都是以二进制(0或1)顺序存储的,每一个1或0被称为1位,而在x86CPU上一个字节是8位。比如一个16位(2字节)的short int型变量的值是1000,那么它的二进制表达就是:00000011 11101000。由于Intel CPU的架构原因,它是按字节倒序存储的,那么就因该是这样:11101000 00000011,这就是定点数1000在内存中的结构。
目前C/C++编译器标准都遵照IEEE制定的浮点数表示法来进行float,double运算。这种结构是一种科学计数法,用符号、指数和尾数来表示,底数定为2——即把一个浮点数表示为尾数乘以2的指数次方再添上符号。下面是具体的规格:
````````符号位 阶码 尾数 长度
float 1 8 23 32
double 1 11 52 64
临时数 1 15 64 80
由于通常C编译器默认浮点数是double型的,下面以double为例:
共计64位,折合8字节。由最高到最低位分别是第63、62、61、……、0位:
最高位63位是符号位,1表示该数为负,0正;
62-52位,一共11位是指数位;
51-0位,一共52位是尾数位。
按照IEEE浮点数表示法,下面将把double型浮点数38414.4转换为十六进制代码。
把整数部和小数部分开处理:整数部直接化十六进制:960E。小数的处理:
0.4=0.5*0+0.25*1+0.125*1+0.0625*0+……
实际上这永远算不完!这就是著名的浮点数精度问题。所以直到加上前面的整数部分算够53位就行了(隐藏位技术:最高位的1不写入内存)。
如果你够耐心,手工算到53位那么因该是:38414.4(10)=1001011000001110.0110101010101010101010101010101010101(2)
科学记数法为:1.001……乘以2的15次方。指数为15!
于是来看阶码,一共11位,可以表示范围是-1024 ~ 1023。因为指数可以为负,为了便于计算,规定都先加上1023,在这里,15+1023=1038。二进制表示为:100 00001110
符号位:正—— 0 !
合在一起(尾数二进制最高位的1不要):
01000000 11100010 11000001 11001101 01010101 01010101 01010101 01010101
按字节倒序存储的十六进制数就是:
55 55 55 55 CD C1 E2 40
从存储结构和算法上来讲,double和float是一样的,不一样的地方仅仅是float是32位的,double是64位的,所以double能存储更高的精度。
任何数据在内存中都是以二进制(0或1)顺序存储的,每一个1或0被称为1位,而在x86CPU上一个字节是8位。比如一个16位(2字节)的short int型变量的值是1000,那么它的二进制表达就是:00000011 11101000。由于Intel CPU的架构原因,它是按字节倒序存储的,那么就因该是这样:11101000 00000011,这就是定点数1000在内存中的结构。
目前C/C++编译器标准都遵照IEEE制定的浮点数表示法来进行float,double运算。这种结构是一种科学计数法,用符号、指数和尾数来表示,底数定为2——即把一个浮点数表示为尾数乘以2的指数次方再添上符号。下面是具体的规格:
````````符号位 阶码 尾数 长度
float 1 8 23 32
double 1 11 52 64
临时数 1 15 64 80
由于通常C编译器默认浮点数是double型的,下面以double为例:
共计64位,折合8字节。由最高到最低位分别是第63、62、61、……、0位:
最高位63位是符号位,1表示该数为负,0正;
62-52位,一共11位是指数位;
51-0位,一共52位是尾数位。
按照IEEE浮点数表示法,下面将把double型浮点数38414.4转换为十六进制代码。
把整数部和小数部分开处理:整数部直接化十六进制:960E。小数的处理:
0.4=0.5*0+0.25*1+0.125*1+0.0625*0+……
实际上这永远算不完!这就是著名的浮点数精度问题。所以直到加上前面的整数部分算够53位就行了(隐藏位技术:最高位的1不写入内存)。
如果你够耐心,手工算到53位那么因该是:38414.4(10)=1001011000001110.0110101010101010101010101010101010101(2)
科学记数法为:1.001……乘以2的15次方。指数为15!
于是来看阶码,一共11位,可以表示范围是-1024 ~ 1023。因为指数可以为负,为了便于计算,规定都先加上1023,在这里,15+1023=1038。二进制表示为:100 00001110
符号位:正—— 0 !
合在一起(尾数二进制最高位的1不要):
01000000 11100010 11000001 11001101 01010101 01010101 01010101 01010101
按字节倒序存储的十六进制数就是:
55 55 55 55 CD C1 E2 40