陈莉君的专栏

仰空冥思

试炼基本功(二)

在上文中提到strlen()函数,最简单的实现应当如下:
size_t strlen(const char *psrc)
{
     size_t  length ;

    for (length = 0; *psrc; ++length);
       psrc++;

    return length;
}

而实际上,根据指针和字符串的特性,可以写出更简洁的代码:

 size_t strlen(const char *psrc)
{
    const char *iter;

    for (iter = psrc; *iter; iter++);

    return iter - psrc;
}

但简洁的代码并不说明是高效的代码。上面的实现都是一次判断一个字符直到发现'/0'为止,这是非常低效的。因为只有当数据所在的内存地址是该数据长度的整数倍时,这样CPU的存取速度最快,也就是数据对齐问题。比如在32位的计算机中,一个WORD为4 字节,则WORD数据的起始地址能被4整除的时候CPU的存取效率比较高。CPU的优化规则大概如下:对于n字节(n = 2,4,8...)的元素,它的首地址能被n整除才能获得最好的性能。

因此,比较高效的实现算法如下:
(1) 一次判断一个字符直到内存对齐,如果在内存对齐之前就遇到'/0'则直接return,否则到(2);
(2);一次读入并判断一个WORD,如果此WORD中没有为0的字节,则继续下一个WORD,否则到(3);
(3) 到这里则说明WORD中至少有一个字节为0,剩下的就是找出第一个为0的字节的位置然后return。


阅读更多
文章标签: 算法 优化
个人分类: 授课之感
想对作者说点什么? 我来说一句

smartflow4.10.31.1

2017年09月15日 48.55MB 下载

没有更多推荐了,返回首页

加入CSDN,享受更精准的内容推荐,与500万程序员共同成长!
关闭
关闭