linux 磁盘blocksize,linux系统中block size最大为多少

本文详细解析了一个用于清零内存的C语言函数`__bzero()`的实现,该函数通过优化循环展开和对齐处理,提高了内存设置为零的效率。讨论了结构体对齐和CPU流水线的影响,并引用了Duff's Device来说明提高效率的原理。
摘要由CSDN通过智能技术生成

void __bzero (void *s, size_t len);

/*

将s的前len字节设为0

思路:先对齐到4的倍数的地址上,对前面的几B直接赋。然后,每次赋个32B,剩余凑不够32B的,

每次赋4B,剩余凑不够4B的,直接赋

*/

void __bzero (void *s, size_t len)

{

long int dstp = (long int) s;

const op_t zero = 0;

if (len >= 8)

{

size_t xlen;

// 处理前面的几B,直到地址为4的倍数,然后可以每次4B

// 这样做的原因与结构体对齐的原因一样,是为提高读写数据的效率

// 由于len >= 8 ,OPSIZ=4,所以不必担心len==0

while (dstp % OPSIZ != 0) // #define op_t unsigned long int

// #define OPSIZ (sizeof(op_t))

// IA-32下是32

{

((byte *) dstp)[0] = 0;

dstp += 1;

len -= 1;

}

// 下面是典型的循环展开以提高效率,每次32B

// 若每次赋一个4B,程序会由于跳转太多而打断cpu流水线,降低效率

// http://www.lysator.liu.se/c/duffs-device.html

// 关键字:Duff's Device

xlen = len / (OPSIZ * 8);

while (xlen != 0)

{

((op_t *) dstp)[0] = zero;

((op_t *) dstp)[1] = zero;

((op_t *) dstp)[2] = zero;

((op_t *) dstp)[3] = zero;

((op_t *) dstp)[4] = zero;

((op_t *) dstp)[5] = zero;

((op_t *) dstp)[6] = zero;

((op_t *) dstp)[7] = zero;

dstp += 8 * OPSIZ;

xlen -= 1;

}

len %= OPSIZ * 8; // 剩余的凑不足8 op_t 的

xlen = len / OPSIZ;

while (xlen != 0) // 每次填4B

{

((op_t *) dstp)[0] = zero;

dstp += OPSIZ;

xlen -= 1;

}

len %= OPSIZ;

}

while (len != 0) // 剩余不够4B的,直接赋值

{

((byte *) dstp)[0] = 0;

dstp += 1;

len -= 1;

}

}

取消

评论

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值