memset的实现及改进
memset函数,用"byte"的值填充内存
void *mymemset(void *pv, byte b, int size) {
byte *pb = (byte *)pv;
while(size-- > 0)
*pb++ = b;
return (pv);
}
但是许多计算机上通过先将要填充到内存块中的小值拼成较大的数据类型,然后用拼出的大值填充内存。由于实际填充的次数减少了,可使编出的memset函数速度更快。如下所示:
long *longfill(long *pv, long l, int size) {
long *pb = pv;
while(size-- > 0)
*pb++ = l;
return (pv);
}
typedef unsigned char byte;
#define sizeThreshold 120
void *mymemset(void *pv, byte b, int size) {
byte *pb = (byte *)pv;
if(size >= sizeThreshold) {
unsigned long l;
l = (b << 8) | b ;
l = (l << 16) | l;
pb = (byte *)longfill((long *)pb, l, size/4);
size %= 4;
}
while(size-- > 0)
*pb++ = b;
return (pv);
}
longfill()用long的值填充内存块。在填完了最后一个长字之后,返回一个指向所填第一个长字的指针。对sizeThreshold的测试,是为了使只有在用long进行填充速度更快时才进行相应的填充。否则仍然使用byte进行填充。
这个memset的唯一问题是它对编译程序和操作系统都做了一定的假设。例如这段代码很明显的假定long占用4个字节的空间,该字节的宽度是8位。对上面程序进行修改,把它写成下面可移植性更好的形式:
void *mymemset(void *pv, byte b, int size) {
byte *pb = (byte *)pv;
if(size >= sizeThreshold) {
unsigned long l;
assert(4 == sizeof(long));
assert(sizeThreshold >= 3);
while(((unsigned long)pb & 3) != 0) {
*pb++ = b;
size--;
}
int k;
for(k = sizeof(long); k > 0; --k)
l = (l << 8) | b;
pb = (long *)longfill((long *)pb, l, size/4);
size %= sizeof(long);
}
while(size-- > 0)
*pb++ = b;
return (pv);
}
如果pv指向的是奇数地址,该程序就会崩溃。这是因为在一些机器上byte*和long*是不可以相互转换的类型,所以如果在奇数地址上存储long就会引起硬件的错误。那么到底应该怎么办?其实在这种情况下,根本不应该企图将memset写成一个可移植的函数。要接受其不可移植这一事实,不要对其进行改动。要避免上述的奇数地址问题,可以先用byte进行填充,填到偶数地址之后,在换用long继续填充。虽然将long对齐到偶数地址上已经可以工作了,如果使其对齐到4字节边界上,性能可能会更好。至于对程序中所做的其他假定,可以利用断言和条件编译进行相同的验证。
void *mymemset(void *pv, byte b, int size) {
byte *pb = (byte *)pv;
#ifdef MC
if(size >= sizeThreshold) {
unsigned long l;
assert(4 == sizeof(long));
assert(sizeThreshold >= 3);
while(((unsigned long)pb & 3) != 0) {
*pb++ = b;
size--;
}
l = (b << 8) | b;
l = (l << 16) | l;
pb = (long *)longfill((long *)pb, l, size/4);
size %= 4;
}
#endif //MC
while(size-- > 0)
*pb++ = b;
return (pv);
}
经过这些改动,很明显这个程序已不再可移植。原先所做的假定或者已经被消除,或者通过断言进行了验证。这些措施使得该程序极少可能被不正确的使用。