在上文中提到strlen()函数,最简单的实现应当如下:
size_t strlen(const char *psrc)
{
size_t length ;
for (length = 0; *psrc; ++length);
psrc++;
return length;
}
而实际上,根据指针和字符串的特性,可以写出更简洁的代码:
size_t strlen(const char *psrc)
{
const char *iter;
for (iter = psrc; *iter; iter++);
return iter - psrc;
}
但简洁的代码并不说明是高效的代码。上面的实现都是一次判断一个字符直到发现'/0'为止,这是非常低效的。因为只有当数据所在的内存地址是该数据长度的整数倍时,这样CPU的存取速度最快,也就是数据对齐问题。比如在32位的计算机中,一个WORD为4 字节,则WORD数据的起始地址能被4整除的时候CPU的存取效率比较高。CPU的优化规则大概如下:对于n字节(n = 2,4,8...)的元素,它的首地址能被n整除才能获得最好的性能。
因此,比较高效的实现算法如下:
(1) 一次判断一个字符直到内存对齐,如果在内存对齐之前就遇到'/0'则直接return,否则到(2);
(2);一次读入并判断一个WORD,如果此WORD中没有为0的字节,则继续下一个WORD,否则到(3);
(3) 到这里则说明WORD中至少有一个字节为0,剩下的就是找出第一个为0的字节的位置然后return。