字符串函数
1.strlen
size_t strlen ( const char * str );
strlen函数返回的是在字符串中 ‘\0’ 前面出现的字符个数(不包
含 ‘\0’ )。
参数指向的字符串必须要以 ‘\0’ 结束。
注意函数的返回值为size_t,是无符号的。所以在比较两个字符串长度时应当做直接比较if(strlen(arr1) > strlen(arr2))
而避免使用if(strlen(str2)-strlen(str1) > 0)
作差的比较方法。
关于strlen的模拟实现主要有三种方法:
1.计数法
统计'\0'
之前的字符个数并返回
size_t my_strlen(const char * str)
{
int count = 0;
while(*str)
{
count++;
str++;
}
return count;
}
2.递归法
若当前字符不为'\0'
则返回1+my_strlen(str+1)
,直到当前字符为'\0'
则结束递归调用。
size_t my_strlen(const char * str)
{
if(*str == '\0')
return 0;
else
return 1+my_strlen(str+1);
}
3.指针- 指针法
先创建一个临时的指针变量存放待计算字符串的起始地址,然后寻找字符串的结束标志'\0'
,最后结束地址减去起始地址即为字符串长度。
size_t my_strlen(const char *s)
{
char *p = s;
while(*p != ‘\0’ )
p++;
return p-s;
}
2.strcpy,strncpy
strcpy
char* strcpy(char * destination, const char * source );
如果我们想要改变一个字符串的值并不能使用等号直接赋值,我们需要使用strcpy函数进行赋值,如
char str[5] = "chen";
strcpy(str, "wu");
在使用strcpy函数时有以下几点需要注意:
1.源字符串必须以 ‘\0’ 结束。
2.会将源字符串中的 ‘\0’ 拷贝到目标空间。
3.目标空间必须足够大,以确保能存放源字符串。
4.目标空间必须可变。
strcat、strcpy、strncat、strncpy这四个函数的返回值都为目标字符串的起始地址4个函数中源字符串可以是字符串常量("abcd"
)也可以是字符串数组。
strcpy函数的模拟实现如下:
#include<assert.h>
char* my_strcpy(char* destination, const char* source)
{
assert(destniation && source);
char* p = destnation;
while (*source != '\0')
*destniation++ = *source++;
*destination = *source;
return p;
}
strncpy
char * strncpy ( char * destination, const char * source, size_t num );
strncpy拷贝num个字符从源字符串到目标空间。
如果源字符串的长度小于num,则拷贝完源字符串之后,在目标的后边追加0,直到num个。
strncpy函数可以说是升级版的strcpy函数,因为使用时拷贝需要考虑拷贝的字符数目,出现越界访问的情况会相对减少,可以说strncpy函数是一个较为安全的字符串拷贝函数。
3.strcat,strncat
char * strcat ( char * destination, const char * source );
strcat函数实现了在目标字符串结束处('\0'
)开始添加字符串的功能。
char str[10] = "chen";
strcat(str, "yu");
在使用strcat函数时需要注意以下几点:
1.源字符串必须以 ‘\0’ 结束。
2.目标空间必须有足够的大,能容纳下源字符串的内容。
3.目标空间必须可修改。
4.不能字符串自己给自己追加。
关于第四点,如果我们尝试将字符串自己给自己追加,就相当于源字符串和目标字符串为同一个字符串。由于strcat是从目标字符串的结尾开始复制字符,它会不断追加目标字符串的复制,字符串的无限追加会导致越界访问,出现访问冲突等问题。
下面是strcat函数的模拟实现:
#includ <assert.h>
char* my_strcat(char* destination, const char* source)
{
assert(destination && source);
char* tmp = destination;
while (*destination != '\0')
destination++;
while (*source != '\0')
{
*destination = *source;
destination++;
source++;
}
*destination = '\0';
return tmp;
}
strncat
char * strncat ( char * destination, const char * source, size_t num );
将源字符串的num个字符追加到目标字符串,外加一个'\0'
字符。
如果源字符串的长度小于 num,则仅源字符串的内容。
4.strcmp,strncmp
int strcmp ( const char * str1, const char * str2 );
int strncmp ( const char * str1, const char * str2, size_t num );
这两个函数都是用于字符串的比较,strncmp只比较前num个字符,strcmp函数比较的是整个字符串的大小;
在c语言标准中规定:
第一个字符串大于第二个字符串,则返回大于0的数字
第一个字符串等于第二个字符串,则返回0
第一个字符串小于第二个字符串,则返回小于0的数字
char str1[10] = "chenyu";
char str2[10] = "chenyizz";
字符串的比较比较的是ASCII码值,从第一个字符开始一一比较,上面的两个字符串中前五个字符"cheny"相同,但’u’的ASCII码值为117,'i’的ASCII码值为105,117 > 105,所以str1>str2。
strcmp的模拟实现如下:
#includ <assert.h>
int my_strcmp(const char* str1, const char* str2)
{
while (*str1 == *str2)
{
if (*str1 == '\0')
return 0;
str1++;
str2++;
}
return *str1 - *str2;
}
5.strstr
char * strstr ( const char *str1, const char * str2);
strstr函数的功能是在字符串str1中寻找字符串str2,若找到则返回str2在str1中的地址,若找不到则返回NULL
。
下面是该函数的模拟实现。
#includ <assert.h>
const char* my_strstr(const char* arr1, const char* arr2)
{
assert(arr1 && arr2);
const char* s1;
const char* s2;
while (*arr1)
{
s1 = arr1;
s2 = arr2;
while (*s1 == *s2 && *s1 && *s2)
{
s1++;
s2++;
}
if (*s2 == '\0')
return arr1;
arr1++;
}
return NULL;
}
6.strtok
char * strtok ( char * str, const char * sep );
函数strtok的声明中:sep参数是个字符串,定义了用作分隔符的字符集合;
参数str指定一个字符串,该字符串中包含了0个或多个由sep中的一个或多个分隔符分割的标记;
strtok函数的返回值:strtok函数找到str中的下一个标记,并将其用 \0 结尾,返回一个指向这个标记的指针;strtok函数的第一个参数不为 NULL ,函数将找到str中第一个标记,strtok函数将保存它在字符串中的位置;
strtok函数的第一个参数为 NULL ,函数将在同一个字符串中被保存的位置开始,查找下一个标记;
如果字符串中不存在更多的标记,则返回 NULL 指针;
使用案例如下:
#include <stdio.h>
int main()
{
char *p = "chenyuyi233@163.com";
const char* sep = ".@";
char arr[30];
char *str = NULL;
strcpy(arr, p);//strtok函数会改变被操作的字符串,使用临时拷贝的字符串进行操作。
for(str=strtok(arr, sep); str != NULL; str=strtok(NULL, sep))
{
printf("%s\n", str);
}
return 0;
}
output:
chenyuyi233
163
com
7.strerror
char * strerror ( int errnum );
strerror函数返回错误码所对应的错误信息。
错误码存放在全局变量errno中;
8.字符分类函数
函数 | 如果他的参数符合下列条件就返回真 |
---|---|
iscntrl | 任何控制字符 |
isspace | 空白字符:空格‘ ’,换页‘\f’,换行’\n’,回车‘\r’,制表符’\t’或者垂直制表符’\v’ |
isdigit | 十进制数字 0-9 |
isxdigit | 十六进制数字,包括所有十进制数字,小写字母a-f,大写字母A-F |
islower | 小写字母a-z |
isupper | 大写字母A-Z |
isalpha | 字母a-z或A-Z |
isalnum | 字母或者数字,a-z,A-Z,0-9 |
ispunct | 标点符号,任何不属于数字或者字母的图形字符(可打印) |
isgraph | 任何图形字符 |
isprint | 任何可打印字符,包括图形字符和空白字符 |
9.字符转换函数
int tolower ( int c );
int toupper ( int c );
tolower将大写字母转换成小写
toupper将小写字母转换成大写
内存函数
在内存函数的使用中要注意是以字节为单位的数据更改,所以多用于对内存中的char类型,unsigned char类型的操作
1.memcpy
void * memcpy ( void * destination, const void * source, size_t num );
函数memcpy从source的位置开始向后复制num个字节的数据到destination的内存位置。
这个函数在遇到 ‘\0’ 的时候并不会停下来。
如果source和destination有任何的重叠,复制的结果都是未定义的。
函数的返回值为目标空间的起始地址
在vs2022中memcpy函数的功能超出了标准的定义可以实现重叠数据的复制。
下面为该函数的模拟实现方法:
void* my_memcpy(void* destination, const void* source, size_t num)
{
assert(destination && source);
for (int i = 0; i < num; i++)
{
*((char*)destination + i) = *((char*)source + i);
}
return destination;
}
2.memmove
void * memmove ( void * destination, const void * source, size_t num );
memmove和memcpy的差别就是memmove函数处理的源内存块和目标内存块是可以重叠的。
如果源空间和目标空间出现重叠,就得使用memmove函数处理。
函数的返回值为目标空间的起始地址
下面为该函数的模拟实现方法。因为可能出现目标空间和源空间重叠的情况所以分两种情况讨论,当destination < source即源空间地址高于目标空间时采用从前往后修改目标空间值。destination > source即源空间地址低于目标空间时采用从后往前赋值的方法修改数据。
#include <assert.h>
void* my_memmove(void* destination, const void* source, size_t num)
{
assert(destination && source);
if(destination < source)
for (int i = 0; i < (int)num; i++)
{
*((char*)destination + i) = *((char*)source + i);
}
else
for (int i = (int)num - 1; i >= 0; i--)
{
*((char*)destination + i) = *((char*)source + i);
}
return destination;
}
3.memcmp
int memcmp ( const void * ptr1,const void * ptr2,size_t num );
比较从ptr1和ptr2指针开始的num个字节。当ptr1和ptr2中的值一一比较后每个字节的值都相等时返回0;一一比较中出现的第一个不相等的值,若ptr1中的值大于ptr2中的值则返回大于0的数,反之则返回小于0的数(ptr1和ptr2中的值作为unsigned char的值进行计算);