C语言字符串函数详解
void *memset(void *dest, int c, size_t count);
将dest前面count个字符置为字符c.
返回dest的值.
void *memmove(void *dest, const void *src, size_tcount);
从src复制count字节的字符到dest. 如果src和dest出现重叠, 函数会自动处理.
返回dest的值.
void *memcpy(void *dest, const void *src, size_tcount);
从src复制count字节的字符到dest. 与memmove功能一样, 只是不能处理src和dest出现重叠.
返回dest的值.
void *memchr(const void *buf, int c, size_t count);
在buf前面count字节中查找首次出现字符c的位置. 找到了字符c或者已经搜寻了count个字节, 查找即停止.
操作成功则返回buf中首次出现c的位置指针, 否则返回NULL.
void *_memccpy(void *dest, const void *src, intc, size_t count);
从src复制0个或多个字节的字符到dest. 当字符c被复制或者count个字符被复制时, 复制停止.
如果字符c被复制, 函数返回这个字符后面紧挨一个字符位置的指针. 否则返回NULL.
int memcmp(const void *buf1, const void *buf2,size_t count);
比较buf1和buf2前面count个字节大小.
返回值< 0, 表示buf1小于buf2;
返回值为0, 表示buf1等于buf2;
返回值> 0, 表示buf1大于buf2.
int memicmp(const void *buf1, const void *buf2,size_t count);
比较buf1和buf2前面count个字节. 与memcmp不同的是, 它不区分大小写.
返回值同上.
size_t strlen(const char *string);
获取字符串长度, 字符串结束符NULL不计算在内.
没有返回值指示操作错误.
char *strrev(char *string);
将字符串string中的字符顺序颠倒过来. NULL结束符位置不变.
返回调整后的字符串的指针.
char *_strupr(char *string);
将string中所有小写字母替换成相应的大写字母, 其它字符保持不变.
返回调整后的字符串的指针.
char *_strlwr(char *string);
将string中所有大写字母替换成相应的小写字母, 其它字符保持不变.
返回调整后的字符串的指针.
char *strchr(const char *string, int c);
查找字符c在字符串string中首次出现的位置, NULL结束符也包含在查找中.
返回一个指针, 指向字符c在字符串string中首次出现的位置, 如果没有找到, 则返回NULL.
char *strrchr(const char *string, int c);
查找字符c在字符串string中最后一次出现的位置, 也就是对string进行反序搜索, 包含NULL结束符.
返回一个指针, 指向字符c在字符串string中最后一次出现的位置, 如果没有找到, 则返回NULL.
char *strstr(const char *string, const char *strSearch);
在字符串string中查找strSearch子串.
返回子串strSearch在string中首次出现位置的指针. 如果没有找到子串strSearch, 则返回NULL. 如果子串strSearch为空串, 函数返回string值.
char *strdup(const char *strSource);
函数运行中会自己调用malloc函数为复制strSource字符串分配存储空间, 然后再将strSource复制到分配到的空间中. 注意要及时释放这个分配的空间.
返回一个指针, 指向为复制字符串分配的空间; 如果分配空间失败, 则返回NULL值.
char *strcat(char *strDestination, const char *strSource);
将源串strSource添加到目标串strDestination后面, 并在得到的新串后面加上NULL结束符. 源串strSource的字符会覆盖目标串strDestination后面的结束符NULL. 在字符串的复制或添加过程中没有溢出检查, 所以要保证目标串空间足够大. 不能处理源串与目标串重叠的情况.
函数返回strDestination值.
char *strncat(char *strDestination, const char*strSource, size_t count);
将源串strSource开始的count个字符添加到目标串strDest后. 源串strSource的字符会覆盖目标串strDestination后面的结束符NULL. 如果count大于源串长度, 则会用源串的长度值替换count值. 得到的新串后面会自动加上NULL结束符. 与strcat函数一样, 本函数不能处理源串与目标串重叠的情况.函数返回strDestination值.
char *strcpy(char *strDestination, const char *strSource);
复制源串strSource到目标串strDestination所指定的位置, 包含NULL结束符. 不能处理源串与目标串重叠的情况.
函数返回strDestination值.
char *strncpy(char *strDestination, const char*strSource, size_t count);
将源串strSource开始的count个字符复制到目标串strDestination所指定的位置. 如果count值小于或等于strSource串的长度, 不会自动添加NULL结束符目标串中, 而count大于strSource串的长度时, 则将strSource用NULL结束符填充补齐count个字符, 复制到目标串中. 不能处理源串与目标串重叠的情况.
函数返回strDestination值.
char *strset(char *string, int c);
将string串的所有字符设置为字符c, 遇到NULL结束符停止.
函数返回内容调整后的string指针.
char *strnset(char *string, int c, size_t count);
将string串开始count个字符设置为字符c, 如果count值大于string串的长度, 将用string的长度替换count值.
函数返回内容调整后的string指针.
size_t strspn(const char *string, const char *strCharSet);
查找任何一个不包含在strCharSet串中的字符 (字符串结束符NULL除外) 在string串中首次出现的位置序号.
返回一个整数值, 指定在string中全部由characters中的字符组成的子串的长度. 如果string以一个不包含在strCharSet中的字符开头, 函数将返回0值.
size_t strcspn(const char *string, const char *strCharSet);
查找strCharSet串中任何一个字符在string串中首次出现的位置序号, 包含字符串结束符NULL.
返回一个整数值, 指定在string中全部由非characters中的字符组成的子串的长度. 如果string以一个包含在strCharSet中的字符开头, 函数将返回0值.
char *strspnp(const char *string, const char *strCharSet);
查找任何一个不包含在strCharSet串中的字符 (字符串结束符NULL除外) 在string串中首次出现的位置指针.
返回一个指针, 指向非strCharSet中的字符在string中首次出现的位置.
char *strpbrk(const char *string, const char *strCharSet);
查找strCharSet串中任何一个字符在string串中首次出现的位置, 不包含字符串结束符NULL.
返回一个指针, 指向strCharSet中任一字符在string中首次出现的位置. 如果两个字符串参数不含相同字符, 则返回NULL值.
int strcmp(const char *string1, const char *string2);
比较字符串string1和string2大小.
返回值< 0, 表示string1小于string2;
返回值为0, 表示string1等于string2;
返回值> 0, 表示string1大于string2.
int stricmp(const char *string1, const char *string2);
比较字符串string1和string2大小,和strcmp不同, 比较的是它们的小写字母版本.
返回值与strcmp相同.
int strcmpi(const char *string1, const char *string2);
等价于stricmp函数, 只是提供一个向后兼容的版本.
int strncmp(const char *string1, const char *string2,size_t count);
比较字符串string1和string2大小,只比较前面count个字符. 比较过程中, 任何一个字符串的长度小于count,则count将被较短的字符串的长度取代. 此时如果两串前面的字符都相等, 则较短的串要小.
返回值< 0, 表示string1的子串小于string2的子串;
返回值为0, 表示string1的子串等于string2的子串;
返回值> 0, 表示string1的子串大于string2的子串.
int strnicmp(const char *string1, const char *string2,size_t count);
比较字符串string1和string2大小,只比较前面count个字符. 与strncmp不同的是, 比较的是它们的小写字母版本.
返回值与strncmp相同.
char *strtok(char *strToken, const char *strDelimit);
在strToken 串中查找下一个标记, strDelimit字符集则指定了在当前查找调用中可能遇到的分界符.
返回一个指针, 指向在strToken中找到的下一个标记. 如果找不到标记, 就返回NULL值. 每次调用都会修改strToken内容, 用NULL字符替换遇到的每个分界符.
常见的C字符串处理函数的源代码
char*strcpy(char *strDes, const char *strSrc)
{
assert((strDes != NULL) &&(strSrc != NULL));
char *address = strDes;
while ((*strDes ++ = *strSrc ++) !='\0')
NULL;
return address;
}
char*strchr_(char *str, int c)
{
assert(str != NULL);
while ((*str != (char) c) &&(*str != '\0'))
str ++;
if (*str != '\0')
return str;
return NULL;
}
char*strchr(const char *str, int c)
{
assert(str != NULL);
for (; *str != (char) c; ++ str)
if (*str == '\0')
return NULL;
return (char *) str;
}
int strcmp(constchar *s, const char *t)
{
assert(s != NULL && t !=NULL);
while (*s && *t && *s== *t)
{
++ s;
++ t;
}
return (*s - *t);
}
char*strcat(char *strDes, const char *strSrc)
{
assert((strDes != NULL) &&(strSrc != NULL));
char *address = strDes;
while (*strDes != '\0')
++ strDes;
while ((*strDes ++ = *strSrc ++) !='\0')
NULL;
return address;
}
int strlen(constchar *str)
{
assert(str != NULL);
int len = 0;
while (*str ++ != '\0')
++ len;
return len;
}
char*strdup(const char *strSrc)
{
assert(strSrc != NULL);
int len = 0;
while (*strSrc ++ != '\0')
++ len;
char *strDes = (char *) malloc (len +1);
while ((*strDes ++ = *strSrc ++) !='\0')
NULL;
return strDes;
}
char*strstr(const char *strSrc, const char *str)
{
assert(strSrc != NULL && str!= NULL);
const char *s = strSrc;
const char *t = str;
for (; *t != '\0'; ++ strSrc)
{
for (s = strSrc, t = str; *t !='\0' && *s == *t; ++s, ++t)
NULL;
if (*t == '\0')
return (char *) strSrc;
}
return NULL;
}
char*strncpy(char *strDes, const char *strSrc, int count)
{
assert(strDes != NULL &&strSrc != NULL);
char *address = strDes;
while (count -- && *strSrc !='\0')
*strDes ++ = *strSrc ++;
return address;
}
char*strncat(char *strDes, const char *strSrc, int count)
{
assert((strDes != NULL) &&(strSrc != NULL));
char *address = strDes;
while (*strDes != '\0')
++ strDes;
while (count -- && *strSrc !='\0' )
*strDes ++ = *strSrc ++;
*strDes = '\0';
return address;
}
int strncmp(constchar *s, const char *t, int count)
{
assert((s != NULL) && (t !=NULL));
while (*s && *t && *s== *t && count --)
{
++ s;
++ t;
}
return (*s - *t);
}
char*strpbrk(const char *strSrc, const char *str)
{
assert((strSrc != NULL) &&(str != NULL));
const char *s;
while (*strSrc != '\0')
{
s = str;
while (*s != '\0')
{
if (*strSrc == *s)
return (char *) strSrc;
++ s;
}
++ strSrc;
}
return NULL;
}
intstrcspn(const char *strSrc, const char *str)
{
assert((strSrc != NULL) &&(str != NULL));
const char *s;
const char *t = strSrc;
while (*t != '\0')
{
s = str;
while (*s != '\0')
{
if (*t == *s)
return t - strSrc;
++ s;
}
++ t;
}
return 0;
}
int strspn(constchar *strSrc, const char *str)
{
assert((strSrc != NULL) &&(str != NULL));
const char *s;
const char *t = strSrc;
while (*t != '\0')
{
s = str;
while (*s != '\0')
{
if (*t == *s)
break;
++ s;
}
if (*s == '\0')
return t - strSrc;
++ t;
}
return 0;
}
char*strrchr(const char *str, int c)
{
assert(str != NULL);
const char *s = str;
while (*s != '\0')
++ s;
for (-- s; *s != (char) c; -- s)
if (s == str)
return NULL;
return (char *) s;
}
char*strrev(char *str)
{
assert(str != NULL);
char *s = str, *t = str, c;
while (*t != '\0')
++ t;
for (-- t; s < t; ++ s, -- t)
{
c = *s;
*s = *t;
*t = c;
}
return str;
}
char*strnset(char *str, int c, int count)
{
assert(str != NULL);
char *s = str;
for (; *s != '\0' && s - str< count; ++ s)
*s = (char) c;
return str;
}
char *strset(char*str, int c)
{
assert(str != NULL);
char *s = str;
for (; *s != '\0'; ++ s)
*s = (char) c;
return str;
}
char*strtok(char *strToken, const char *str)
{
assert(strToken != NULL &&str != NULL);
char *s = strToken;
const char *t = str;
while (*s != '\0')
{
t = str;
while (*t != '\0')
{
if (*s == *t)
{
*(strToken + (s -strToken)) = '\0';
return strToken;
}
++ t;
}
++ s;
}
return NULL;
}
char*strupr(char *str)
{
assert(str != NULL);
char *s = str;
while (*s != '\0')
{
if (*s >= 'a' && *s<= 'z')
*s -= 0x20;
s ++;
}
return str;
}
char*strlwr(char *str)
{
assert(str != NULL);
char *s = str;
while (*s != '\0')
{
if (*s >= 'A' && *s<= 'Z')
*s += 0x20;
s ++;
}
return str;
}
void *memcpy(void*dest, const void *src, int count)
{
assert((dest != NULL) && (src!= NULL));
void *address = dest;
while (count --)
{
*(char *) dest = *(char *) src;
dest = (char *) dest + 1;
src = (char *) src + 1;
}
return address;
}
void*memccpy(void *dest, const void *src, int c, unsigned int count)
{
assert((dest != NULL) && (src!= NULL));
while (count --)
{
*(char *) dest = *(char *) src;
if (* (char *) src == (char) c)
return ((char *)dest + 1);
dest = (char *) dest + 1;
src = (char *) src + 1;
}
return NULL;
}
void*memchr(const void *buf, int c, int count)
{
assert(buf != NULL);
while (count --)
{
if (*(char *) buf == c)
return (void *) buf;
buf = (char *) buf + 1;
}
return NULL;
}
int memcmp(constvoid *s, const void *t, int count)
{
assert((s != NULL) && (t !=NULL));
while (*(char *) s && *(char*) t && *(char *) s == *(char *) t && count --)
{
s = (char *) s + 1;
t = (char *) t + 1;
}
return (*(char *) s - *(char *) t);
}
void*memmove(void *dest, const void *src, int count)
{
assert(dest != NULL && src !=NULL);
void *address = dest;
while (count --)
{
*(char *) dest = *(char *) src;
dest = (char *) dest + 1;
src = (const char *)src + 1;
}
return address;
}
void*memset(void *str, int c, int count)
{
assert(str != NULL);
void *s = str;
while (count --)
{
*(char *) s = (char) c;
s = (char *) s + 1;
}
return str;
}
已知strcpy函数的原型是:
char * strcpy(char * strDest,constchar * strSrc);
1.不调用库函数,实现strcpy函数。
2.解释为什么要返回char *。
解说:
1.strcpy的实现代码
char * strcpy(char * strDest,const char *strSrc)
{
if ((strDest==NULL)||(strSrc==NULL))// [1]
throw "Invalidargument(s)"; // [2]
char * strDestCopy=strDest; // [3]
while ((*strDest++=*strSrc++)!='\0');// [4]
return strDestCopy;
}
错误的做法:
[1] (A)不检查指针的有效性,说明答题者不注重代码的健壮性。
(B)检查指针的有效性时使用((!strDest)||(!strSrc))或(!(strDest&&strSrc)),说明答题者对C语言中类型的隐式转换没有深刻认识。在本例中char *转换为bool即是类型隐式转换,这种功能虽然灵活,但更多的是导致出错概率增大和维护成本升高。所以C++专门增加了bool、true、false三个关键字以提供更安全的条件表达式。
(C)检查指针的有效性时使用((strDest==0)||(strSrc==0)),说明答题者不知道使用常量的好处。直接使用字面常量(如本例中的0)会减少程序的可维护性。0虽然简单,但程序中可能出现很多处对指针的检查,万一出现笔误,编译器不能发现,生成的程序内含逻辑错误,很难排除。而使用NULL代替0,如果出现拼写错误,编译器就会检查出来。
[2] (A)return new string("Invalidargument(s)");,说明答题者根本不知道返回值的用途,并且他对内存泄漏也没有警惕心。从函数中返回函数体内分配的内存是十分危险的做法,他把释放内存的义务抛给不知情的调用者,绝大多数情况下,调用者不会释放内存,这导致内存泄漏。
(B)return 0;,说明答题者没有掌握异常机制。调用者有可能忘记检查返回值,调用者还可能无法检查返回值(见后面的链式表达式)。妄想让返回值肩负返回正确值和异常值的双重功能,其结果往往是两种功能都失效。应该以抛出异常来代替返回值,这样可以减轻调用者的负担、使错误不会被忽略、增强程序的可维护性。
[3] (A)忘记保存原始的strDest值,说明答题者逻辑思维不严密。
[4] (A)循环写成while(*strDest++=*strSrc++);,同[1](B)。
(B)循环写成while(*strSrc!='\0') *strDest++=*strSrc++;,说明答题者对边界条件的检查不力。循环体结束后,strDest字符串的末尾没有正确地加上'\0'。
2.返回strDest的原始值使函数能够支持链式表达式,增加了函数的“附加值”。同样功能的函数,如果能合理地提高的可用性,自然就更加理想。
链式表达式的形式如:
intiLength=strlen(strcpy(strA,strB));
又如:
char * strA=strcpy(newchar[10],strB);
返回strSrc的原始值是错误的。其一,源字符串肯定是已知的,返回它没有意义。其二,不能支持形如第二例的表达式。其三,为了保护源字符串,形参用const限定strSrc所指的内容,把const char *作为char *返回,类型不符,编译报错。