31 30 23 22 0
S | E | M |
符号位(sign)占1位,S=0表示+,S=1表示-
指数位(exponent)占8位,阶码E=e+127
尾数位(mantissa),占23位,规格化1.M,小数点前面的1隐藏
为什么要加上指数偏移值?2^(e-1)-1=127
好处是可以用长度为e个bit的无符号整数来表示所有的指数取值,使得两个浮点数的指数大小的比较更为容易直观
为什么偏移值是127?
阶码E全0(0)和全1(255)保留用作特殊值的处理,表示0(-127)和∞(128),对于规格化浮点数,E的变化范围为1-254,真正的指数值为e为-126-127
关于原码,反码,补码,移码的概念 参考这篇博文,总结的很好点击打开链接
关于补码-128
原码:+0=00000000
-0=10000000
反码:+0=00000000
-0=11111111
补码:+0=00000000=-0
-128=10000000
补码是为了处理0不分+-的问题而引入的 即+0=-0=0,都是用00000000来表示,那么多余的10000000就用来表示-128
float的精度为何只有6-7位?
float:2^23=8388608,一共7位,这意味着最多能有7位有效数字,绝对能保证的为6位
double的精度为何是15-16位?
double:2^52=4503599627370496,一共16位
浮点数为何不能用==来判断是否相等?
就是因为浮点数的精度问题,计算机内部不能精确的表示一些浮点数值,如果想要判断两个浮点数x和y是否相等,不是x==y,而是x-y<=0.000001,具体看精度要求
%f %e %g的区别?
double a=1000000;
double b=123.456;
%f 1000000.000000 浮点数计数法
123.456000
%e 1.000000e+6 科学技术法
1.234560e+2
%g 1e+6 指数小于-4或者大于5采用%e,否则采用%f
123.456
十六进制浮点常量(PS:没有八进制浮点常量)
0x0.3P10表示的值位0.0011*2^10=11000000=192
将变量声明为unsign int、long int 、short int时,关键字int可以省略,unsigned只能限定int和char
long int、long long int属于各自的类型,必须使用NSLog字符%li、%lli显示
浮点数常量输入默认为十进制,八进制、十六进制NSLog字符%o、%x只能显示整数