这个世界上有为少写一条if语句纠结过的人吗?
还真有,不过不是本人,是最牛叉的web server的作者。
首先充点电:
一个最简单的if判断大约生成几条汇编指令,如if (a >= 3) ?
int a = 1; // (1)
if (a >= 3) { // (2)
printf("33333"); // (3)
}
gcc 大约生成如下的汇编:
movl $1, -4(%rbp) #类似int a = 1
cmpl $2, -4(%rbp) #实现 if(a >= 3) 效果的汇编
jle .L2
充电的结果是,知道一个判断语句至少产生两条汇编指令,比较指令,如cmpl 和 跳转指令,如jle 。
一个由两条表达组成的if判断大约产生几条汇编指令,如if (a >= '0' && a <= '9') ?
int a = 1;
if (a >= '0' && a <= '9') {
printf("=======\n");
}
gcc 大约生成如下的汇编:
movl $1, -4(%rbp) #类似 int a = 1
cmpl $47, -4(%rbp) #实现 if (a >= '0') 效果的汇编
jle .L2
cmpl $57, -4(%rbp) #实现 if (a <= '9') 效果的汇编
jg .L2
对比上面可以发现多加一个表达式,多生成两条汇编指令。
如何把大写字母转小写字母:
int ch, c;
ch = 'A'
c = ch | 0x20;
如何把一个16进制的字符转成10进制:
int value;
char c;
if (c >=' 0' && c <= '9')
value = value * 16 + c - '0';
else if(c >= 'a' && c <= 'f')
value = value * 16 + c - 'a' + 10;
else if(c >= 'A' && c <= 'F')
value = value * 16 + c - 'A' + 10;
好,现在进入主题,编写函数hextoi,把有16进制数字组成的字符串(包含可选的前缀0x或0X)转为与之相等的整形值。
字符串中允许包含的数字包括:0~9、a-f、A-F。
实现1:
int hextoi(char *s) {
char c;
int val;
if (*s == '0') {
s++;
if (*s == 'x' || *s == 'X')
s++;
}
for (val = 0; *s; s++) {
c = *s;
if (c >= '0' && c <= '9')
val = val * 16 + c - '0';
else if (c >= 'a' && c <= 'f')
val = val * 16 + c - 'a' + 10;
else if (c >= 'A' && c <= 'F')
val = val * 16 + c - 'A' + 10;
else
return val;
}
return val;
}
实现2:
int hextoi(char *s) {
char c, ch;
int val;
if (*s == '0') {
s++;
if (*s == 'x' || *s == 'X')
s++;
}
for (val = 0; *s; s++) {
ch = *s;
if (ch >= '0' && ch <= '9') {
val = val * 16 + ch - '0';
continue;
}
c = ch | 0x20;
if (c >= 'a' && c <= 'f') {
val = val * 16 + c - 'a' + 10;
continue;
}
return val;
}
return val;
}
实现1与实现2的区别是?
区别1 --想法。
实现1是大多数人可以想到。
实现2实现比较怪异,一开始不知道为什么要这么做。
区别2 --代码特征。
实现1用if else 判断 a-f和A-F的字符
实现2先把A-F的字符转成a-f的,
省去
else if (c >= 'A' && c <= 'F')
val = val * 16 + c - 'A' + 10;
多了
c = ch | 0x20;
区别3--效率(实现2效率更高)。
可以用gcc -S 生成汇编,数下两个函数生成的汇编。
实现1 需要110行汇编,实现2 只要100行汇编。
为什么会这样,原来实现2中省去的if 判断会生成如下的汇编:
- cmpb $64, -1(%rbp)
- jle .L8
- cmpb $70, -1(%rbp)
- jg .L8
- movl -8(%rbp), %eax
- movl %eax, %edx
- sall $4, %edx
- movsbl -1(%rbp), %eax
- addl %edx, %eax
- subl $55, %eax
- movl %eax, -8(%rbp)
- jmp .L6
-.L8:
而实现2中多出来的部分,生成的汇编代码比较少,如下:
+ movzbl -2(%rbp), %eax
+ orl $32, %eax
+ movb %al, -1(%rbp)
13 - 3 正好是10行,这就是为什么上面实现1,汇编代码是110行,而实现2只有100行。
题外话:
实现2,参考了ngx_hextoi。开头提到的为了少写一条if 的人是谁,大家都懂的。。