[glibc源码分析] bzero

最新推荐文章于 2021-05-09 21:45:52 发布

Tuzki

最新推荐文章于 2021-05-09 21:45:52 发布

阅读量2k

点赞数

文章标签： byte

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Tuzki/article/details/3211989

版权

void __bzero (void *s, size_t len);

/*

将s的前len字节设为0

思路：先对齐到4的倍数的地址上，对前面的几B直接赋。然后，每次赋个32B，剩余凑不够32B的，

每次赋4B，剩余凑不够4B的，直接赋

*/

void __bzero (void *s, size_t len)

{

long int dstp = (long int) s;

const op_t zero = 0;

if (len >= 8)

{

size_t xlen;

// 处理前面的几B，直到地址为4的倍数，然后可以每次4B

// 这样做的原因与结构体对齐的原因一样，是为提高读写数据的效率

// 由于len >= 8 ，OPSIZ=4，所以不必担心len==0

while (dstp % OPSIZ != 0) // #define op_t unsigned long int

// #define OPSIZ (sizeof(op_t))

// IA-32下是32

{

((byte *) dstp)[0] = 0;

dstp += 1;

len -= 1;

}

// 下面是典型的循环展开以提高效率，每次32B

// 若每次赋一个4B，程序会由于跳转太多而打断cpu流水线，降低效率

// http://www.lysator.liu.se/c/duffs-device.html

// 关键字：Duff's Device

xlen = len / (OPSIZ * 8);

while (xlen != 0)

{

((op_t *) dstp)[0] = zero;

((op_t *) dstp)[1] = zero;

((op_t *) dstp)[2] = zero;

((op_t *) dstp)[3] = zero;

((op_t *) dstp)[4] = zero;

((op_t *) dstp)[5] = zero;

((op_t *) dstp)[6] = zero;

((op_t *) dstp)[7] = zero;

dstp += 8 * OPSIZ;

xlen -= 1;

}

len %= OPSIZ * 8; // 剩余的凑不足8 op_t 的

xlen = len / OPSIZ;

while (xlen != 0) // 每次填4B

{

((op_t *) dstp)[0] = zero;

dstp += OPSIZ;

xlen -= 1;

}

len %= OPSIZ;

}

while (len != 0) // 剩余不够4B的，直接赋值

{

((byte *) dstp)[0] = 0;

dstp += 1;

len -= 1;

}

}

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。