一个字节能表示0~255之间共256个数字,根据ASCII码英文字母A-Z和a-z按顺序排列,其中
传统的判断方法是直接判断范围:
但是仔细观察二进制部分会发现以下特点:
(1)所有字母最高两位一定是01
(2)从高位数第三位为0时为大写字母,1时为小写字母
(3)低5位从00001到11010共26种情况分别代表A-Z和a-z
所以得到以下通过分析位来判断的方法:
还有一种方法叫查表法,首先构建一个表,把是字母的都标记为1,其他标记为0,这样就可以通过直接访问表中对应位置的数据得到判断:
建立表:
最后C标准库内也自带了isalpha宏,可以判断是否为字母,在ctype.h里有声明:
现在我们来测试一下三种方法的速度,我们分别用三种方法循环判断0-255之间所有数字是否为ASCII码的英文字母,每种方法10000000次,然后输出所用时间,程序如下:
我的机器使用gcc 4.4.5,无优化选项编译,运行得到的结果为:
显然改进的性能有一定的提升,因为这个任务所需要的计算非常简单,所以查表访问内存(或者缓存)的开销甚至超过了计算所需的时间。