C Primer Plus 01---数据类型深度整理精要(printf没你想的那么简单)
每次看C语言的时候,总是或多或少的会有些收获,这次由于快要找实习了,准备把基础打扎实,所以买了一本C Primer Plus看看,准备重新开始,突然觉得好多知识还是不知道,C语言真的是博大精深。
1.C的数据关键字
原来K&R关键字
C90关键字
C99关键字
int
singed
_Bool
long
void
_Complex
short
_Imaginary
unsigned
char
float
double
2.直接上代码,比较直观,里面注释还算清楚
#include
int main(void)
{
int ten = 10;
int two = 2;
printf("%d***%d---%d\n",ten,2.2,ten - two);//不报错,运行不出错,写这个的原因是为了让内存中有点内容。为了下一个printf数的输出。
printf("%d***%d---%d\n",ten);//但是对于不同的编译器,结果还是不一样的。
//丢失的%d会使用内存中的任意值进行填充,不仅因为内存中的内容不同,而且不同的编译器处理的内存位置也不同(本人亲自验证过)
printf("%d%d",2);
getchar();
return 0;
}
3.说明第二段代码的知识点,事先说明我用的编译器是VC6.0和DEV。
结果分别如下
VC结果:
10***-1717986918---1073846681
10***0---0
20
对于DEV结果如下
10***-1717986918---1073846681
10***-1717986918---1073846681
2-1717986918
发现不同指出了么?没错,是有关整数与小数在内存中存放的位置。当然,这是跟编译器有关的。当然,有兴趣的读者,可以试一下ubuntu看看结果是怎样。
总结如下:
VC的结果大家都很清楚,所以对于VC的结果,我就不说什么了,他实际上是相当于把DEV的结果优化过了,所以变成0。可是对于DEV的结果就涉及到一小部分的存储结构了,找到的资料整理如下。
1.先说一下printf处理参数的原理。
因为该函数的实现用的是可变参数,所以他并不知道你会输入多少参数,而是先按参数从右到左进行压栈,最后把格式化字符串压入栈,然后根据格式化字符串中%c、%d等等,顺序从压栈倒序获取数据,他会一直认为你输入了足够的参数;例如:printf("%d%d",i);对于后边的%d则是会从上级压栈中读取数据,此处就是main()了,当然都是垃圾数据了,会随编译器不同而不同。
2.另一份博客上说的如下,可以稍微说明一下为什么是负数
C/C++浮点数在内存中的存储方式
任何数据在内存中都是以二进制的形式存储的,例如一个short型数据1156,其二进制表示形式为00000100 10000100。则在Intel CPU架构的系统中,存放方式为 10000100(低地址单元) 00000100(高地址单元),因为Intel CPU的架构是小端模式。但是对于浮点数在内存是如何存储的?目前所有的C/C++编译器都是采用IEEE所制定的标准浮点格式,即二进制科学表示法。
在二进制科学表示法中,S=M*2^N 主要由三部分构成:符号位+阶码(N)+尾数(M)。对于float型数据,其二进制有32位,其中符号位1位,阶码8位,尾数23位;对于double型数据,其二进制为64位,符号位1位,阶码11位,尾数52位。
31 30-23 22-0
float 符号位 阶码 尾数
63 62-52 51-0
double 符号位 阶码 尾数
符号位:0表示正,1表示负
阶码:这里阶码采用移码表示,对于float型数据其规定偏置量为127,阶码有正有负,对于8位二进制,则其表示范围为-128-127,double型规定为1023,其表示范围为-1024-1023。比如对于float型数据,若阶码的真实值为2,则加上127后为129,其阶码表示形式为10000010
尾数:有效数字位,即部分二进制位(小数点后面的二进制位),因为规定M的整数部分恒为1,所以这个1就不进行存储了。
下面举例说明:
float型数据125.5转换为标准浮点格式
125二进制表示形式为1111101,小数部分表示为二进制为 1,则125.5二进制表示为1111101.1,由于规定尾数的整数部分恒为1,则表示为1.1111011*2^6,阶码为6,加上127为133,则表示为10000101,而对于尾数将整数部分1去掉,为1111011,在其后面补0使其位数达到23位,则为11110110000000000000000
则其二进制表示形式为
0 10000101 11110110000000000000000,则在内存中存放方式为:
00000000 低地址
00000000
11111011
01000010 高地址
而反过来若要根据二进制形式求算浮点数如0 10000101 11110110000000000000000
由于符号为为0,则为正数。阶码为133-127=6,尾数为11110110000000000000000,则其真实尾数为1.1111011。所以其大小为
1.1111011*2^6,将小数点右移6位,得到1111101.1,而1111101的十进制为125,0.1的十进制为1*2^(-1)=0.5,所以其大小为125.5。
同理若将float型数据0.5转换为二进制形式
0.5的二进制形式为0.1,由于规定正数部分必须为1,将小数点右移1位,则为1.0*2^(-1),其阶码为-1+127=126,表示为01111110,而尾数1.0去掉整数部分为0,补齐0到23位00000000000000000000000,则其二进制表示形式为
0 01111110 00000000000000000000000
由上分析可知float型数据最大表示范围为1.11111111111111111111111*2^127=3.4*10^38
对于double型数据情况类似,只不过其阶码为11位,偏置量为1023,尾数为52位。
测试程序:
/*测试浮点型数据在内存中存放方式 2011.10.2*/
#include
using namespace std;
int main(int argc, char *argv[])
{
float a=125.5;
char *p=(char *)&a;
printf("%d\n",*p);
printf("%d\n",*(p+1));
printf("%d\n",*(p+2));
printf("%d\n",*(p+3));
return 0;
}输出结果为:
0
0
-5
66
在上面已经知道float型125.5在内存中存放方式为:
00000000 低地址
00000000
11111011
01000010 高地址
因此对于p和p+1指向的单元,其中存储的二进制数表示的十进制整数为0;
而对于p+2指向的单元,由于为char型指针,为带符号的数据类型,因此11111011,符号位为1,则为负数,由于在内存中二进制是以补码存储的,所以其真值为-5.
对于p+3指向的单元,01000010,为正数,则其大小为66。上面程序输出结果验证了其正确性。
作者:海子
出处:http://www.cnblogs.com/dolphin0520/
3.另一份博客说法
1. printf的参数:
不仅在这里有用,有时输出的格式控制、格式转换都可能用到!
格式化字符串的格式是:
%[标志][输出最小宽度][.精度][长度]格式字符
标志:标志字符为-、+、#、空格四种,其意义下表所示:
标志 意义
- 结果左对齐,右边填空格
+ 输出符号(正号或负号)
空格 输出值为正时冠以空格,为负时冠以负号
# 对c,s,d,u类无影响;对o类,在输出时加前缀o;对x类,在输出时加前缀0x;对e,g,f 类当结果有小数时才给出小数点(?)
━━━━━━━━━━━━━━━━━━━━━━━━━━
符号 作用
──────────────────────────
%c 单个字符
%d 十进制有符号整数
%e 以“科学记数法”的形式输出十进制的浮点数 如2.451e+02
%f 输出十进制浮点数,不带域宽时,保留6位小数
%g 选用e或f格式中较短的一个输出十进制浮点数,不输出无效零
%0 无输出无符号八进制整数
%p 指针的值
%s 输出字符串
%u 输出无符号十进制整数
%x, %X 输出无符号十六进制整数 (不输出前缀Ox)
2. 计算机浮点数 float 表示
先说说32 位的 float型.
一个浮点数 X, 在计算机中表示为:
X = a * 2e
这里 e 代表指数, a 代表尾数, 在 计算机内部, 他们都是用二进制表示的. 其中 a 用二进制的科学表示法表示, 由于科学表示法第一位总是1 (0除外) , 所以第一位略去不计. e 表示的时候, 因为要表示出负数, 所以 要加上127 , 实际运算的时候要减去 127.
IEEE 规定, 32 位 float型被拆开成以下格式, 左边为高位 :
0 0000 0000 0000000 00000000 00000000
最高位,第32位 第 31-23位,共8位 第23-1位
符号位 指数位 尾数位
0为正,1为负 -127~+127 0~0x 7f ff ff
float 的范围是 -3.40282 * e38 ~ + 3.40282 * e38
一般在人看来是 十进制的数, 要转换成二进制. 十进制转二进制, 大于1 的部分就是除以2 取余, 小于1 的部分乘2 取整.
比如 8.5 转换成二进制就是 1000.1 , 处理成这一步, 还要用科学表示法表示, 就成了 1.0001 * 23 , 注意: 由于1.0001 第一个1 要去掉, 所以成了 0001 , 3 需要加上 127 就成了 130 , 二进制就是 10000010 套用上面话就表示为:
0 10000010 0001000 00000000 00000000
16 进制 就是: 0x 41 98 00 00 , 一般来说 , intel 系列的 CPU 都使用的是 小尾存放, 就是 高字节放在后面, 刚好要掉过来就是: 0x 00 00 98 41 , 这样就完成了一次浮点数的表示.
注意: 浮点数 0.0 在计算机中表示为 0x 00 00 00 00 .
那么浮点数的精度是怎么回事情呢? 当我们使用二进制表示 大于1 的部分的时候, 没有问题, 除以2,一直下去, 最后一位肯定不是1 就是 0; 那么小数部分呢? 举个例子, 比如 0.8
表示 0.8
* 2
1.6 - 1 = 0.6
* 2
1.2 -1 = 0.2 - 0
.* 2
0.4 - 0
*2
0.8 - 0
这样就循环了 就是说 0.8 的二进制 就是 0.11000 11000 ...... 一直循环下去, 而我们计算机如果表示0.8只能取0后面的前25位(第一个1 略去, ^_^), 这就说明 如果是 0.80000000000000000000000001 , 它表示出来的值其实是和 0.8 一样, 所以我们比较float型的数字 用 a == b 其实是没有根据的, 一般都是 用 abs(a - b) < 0.000001 之类就默认是相等. 所以这就出现了经典的 精度问题.
那么 double型呢? 咱们可以照 float 型的葫芦 来画了.
double 型 只是说 取 64 位, 比float型的位 多一倍, 但是同样 逃不出精度的五指山. :)
IEEE 规定 double 型 ,
第64位 63-54 53-1
符号位 指数位 ( -1024 - 1024) 尾数位
所以 double型的范围是 -1.79769 * e308 ~ +1.79769 * e308
多用了几位, 表示范围大了很多, 其实本质跟float型一样.
零散知识点:
1.对于一些算数运算(例如两个很大的数相减),使用浮点数会降低精度
2.short全称short int.同理long的全称也是long int,long long 全称是long long int 。unsigned的全称是unsigned int
读书心得:
1.对于编译器来说,几乎正确仍然是错误
2.一门语言的语法是一套规则