学过C语言的肯定都知道strcpy和strcat,但是这两个函数有个致命的缺陷,它们不检查dst是否有足够的空间,如果src足够长必然会导致缓冲区溢出,于是有就了改进版strncpy和strncat,这两个函数在一定程度上解决了安全问题,但是很多程序员都不愿使用它们,原因如下:
1. 对'\0'的处理
size_t num参数表示需要拷贝的字符个数,在num小于等于src的情况下,strncpy只拷贝前num个字符,并不自动添加\0,如果dst没有全部初始化为\0,输出就会乱码;在num大于src并且src等于dst的情况下,本来strncpy会自动在dst中添加\0,但此时dst空间已经满了,无法再拷贝\0,因此输出也会乱码。
2. 效率问题
另外,假如dst空间足够大,在src远小于dst的情况下,使用sizeof(dst)作为num参数进行拷贝时,会多拷贝dst-src-1次\0,这是完全不需要的操作,因此有人说strncpy的有些行为是很诡异的。
因此使用strncpy时应该显式设置\0,标准方法是这样的:
strncpy(dst, src, sizeof(dst) - 1);
dst[sizeof(dst) - 1] = '\0'; // 手动添加\0
有人说这样写可以避免效率问题:
strncpy(dst, src, strlen(src));
dst[strlen(src)] = '\0'; // 手动添加\0
但其实回到问题的初衷了,原因是从src计算出的字串长度无法保证小于等于dst,可能会导致缓冲区溢出,因此依然无法避免多次拷贝\0的效率问题,strlcpy和strlcat的出现很好的解决了上述两个问题。
size_t strlcpy(char *dst, const char *src, size_t siz);
size_t strlcat(char *dst, const char *src, size_t siz);
strlcpy的源码:
/*
* Copy src to string dst of size siz. At most siz-1 characters
* will be copied. Always NUL terminates (unless siz == 0).
* Returns strlen(src); if retval >= siz, truncation occurred.
*/
size_t
strlcpy(char *dst, const char *src, size_t siz)
{
register char *d = dst;
register const char *s = src;
register size_t n = siz;
if (s == 0 || d == 0) return 0;
/* Copy as many bytes as will fit */
if (n != 0 && --n != 0) {
do {
if ((*d++ = *s++) == 0)
break;
} while (--n != 0);
}
/* Not enough room in dst, add NUL and traverse rest of src */
if (n == 0) {
if (siz != 0)
*d = '\0'; /* NUL-terminate dst */
while (*s++)
;
}
return(s - src - 1); /* count does not include NUL */
}
1. strlcpy可以自动处理\0,只需要将sizeof(dst)作为size参数即可。
2. strlcpy返回strlen(src),用于判断src是否被截断。
int len;
len = strlcpy(dst, src, sizeof(dst));
if (len >= sizeof(dst))
printf("truncation occurred.");
strlcat的源码:
/*
* Appends src to string dst of size siz (unlike strncat, siz is the
* full size of dst, not space left). At most siz-1 characters
* will be copied. Always NUL terminates (unless siz <= strlen(dst)).
* Returns strlen(src) + MIN(siz, strlen(initial dst)).
* If retval >= siz, truncation occurred.
*/
size_t
strlcat(char *dst, const char *src, size_t siz)
{
register char *d = dst;
register const char *s = src;
register size_t n = siz;
size_t dlen;
if (s == 0 || d == 0) return 0;
/* Find the end of dst and adjust bytes left but don't go past end */
while (n-- != 0 && *d != '\0')
d++;
dlen = d - dst;
n = siz - dlen;
if (n == 0)
return(dlen + strlen(s));
while (*s != '\0') {
if (n != 1) {
*d++ = *s;
n--;
}
s++;
}
*d = '\0';
return(dlen + (s - src)); /* count does not include NUL */
}
ps:strlcpy并不属于ANSI C,至今也还不是标准。不过glibc加入了strlcpy函数,目前Linux发行版中都有该函数。Windows下是没有strlcpy的,strcpy的安全版本为strcpy_s,具体查询MSDN。
原文:http://www.gratisoft.us/todd/papers/strlcpy.html
译文:http://blog.csdn.net/linyt/article/details/4383328
参考资料:http://www.cppblog.com/tx7do/archive/2009/10/08/98071.html