今天我们来学习一下C语言中的一些字符函数和字符串函数。在编程的过程中,我们经常要处理字符和字符串,为了⽅便操作字符和字符串,C语⾔标准库中提供了⼀系列库函数,接下来我们就学习⼀下这些函数。
目录
1.字符函数
这些函数的使⽤都需要包含⼀个头⽂件是<ctype.h>,
函数 | 如果它的参数符合下列就返回真 |
iscntrl | 任何控制字符 |
isspace | 空白字符:空格' ',换页'\f',换行'\n',回车'\r',制表符'\t'或垂直制表符'\v' |
isdigit | 十进制数字,'0'~'9'字符 |
isxdigit | 十六进制数字,包括所有十进制数字字符,小写字母a~f,大写字母A~F |
islower | 小写字母a~z |
isupper | 大写字母A~Z |
isalpha | 字母a~z或A~Z |
isalnum | 字母或者数字a~z,A~Z,0~9 |
ispunct | 标点符号,任何不属于数字或字母的图形字符(可打印) |
isgraph | 任何图形字符 |
isprint | 任何可打印字符,包括图形字符和空白字符 |
上述这些函数的使用方式非常相似,所以这里只拿一个函数作为举例:
int islower ( int c );
islower函数是用来判断参数c是否是小写字母,通过返回值来说明是否是⼩写字⺟,如果是⼩写字⺟就返回⾮0的整数,如果不是⼩写字⺟,则返回0。
所以我们可以通过这个函数来实现小写到大写:
#include<stdio.h>
#include<ctype.h>
int main()
{
char str[] = { "Hello World" };
char c;
int i = 0;
while (str[i])
{
c = str[i];
if (islower(c))
{
c -= 32;
}
putchar(c);
i++;
}
}
因为小写字符和大写字符的ASCII码值相差32,所以小写字符的ASCII码-32就得到对应大写字符的ASCII码值,字符串中的大写字符直接打印,小写字符转化为大写字符再打印。
而对于这种大小写字符的转换,C语言有专门的函数可以使用,让我们来看一下:
2.字符转换函数
int tolower ( int c ); //将参数传进去的⼤写字⺟转⼩写
int toupper ( int c ); //将参数传进去的⼩写字⺟转⼤写
#include<stdio.h>
#include<ctype.h>
int main()
{
char str[] = { "Hello World" };
char c;
int i = 0;
while (str[i])
{
c = str[i];
if (islower(c))
{
c = toupper(c);
}
putchar(c);
i++;
}
}
首先判断是不是小写字符,若是则通过toupper函数来实现大小写转换,若不是,则可以直接打印。
字符函数我们就先学习到这里,接下来我们来看字符串函数。
3.strlen函数的使用和实现
size_t strlen ( const char * str );
对于strlen函数,需要注意的点有:
- 字符串以 '\0' 作为结束标志,strlen函数返回的是在字符串中 '\0' 前⾯出现的字符个数(不包含 '\0' )。
- 参数指向的字符串必须要以 '\0' 结束。
- 注意函数的返回值为 size_t,是⽆符号的( 易错 )
- strlen的使⽤需要包含头⽂件<sreing.h>
接下来我们来看一下strlen函数的实现:
我们知道strlen函数统计的是对字符串'\0' 前的字符的个数,所以我们首先可以创建一个变量来专门统计字符个数,这也就是第一种方法:
size_t my_strlen(const char* str)
{
int count = 0;
assert(str);
while (*str)
{
count++;
str++;
}
return count;
}
那么,如果无法创建临时变量那么应该如何统计字符个数呢?不难发现,strlen函数是一次一次循环直到字符串中出现'\0' ,所以可以把循环写成函数的一种形式:递归。这也是实现strlen函数的第二种方式:
size_t my_strlen(const char* str)
{
assert(str);
if (*str == '\0')
{
return 0;
}
else
{
return 1 + my_strlen(str + 1);
}
}
我们在学习指针的时候学习到了指针-指针的操作,当时说结果是两个指针间的数据个数,所以我们可以使用指针-指针来计算字符个数:
size_t my_strlen(const char* str)
{
assert(str);
char* p = str;
while (*p != '\0')
{
p++;
}
return p - str;
}
strlen函数先学习到这里,我们来看下一个函数:
4.strcpy函数的使用和实现
char* strcpy(char * destination, const char * source );
strcpy函数的用处是将source的字符串复制到destination中,
strcpy函数需要注意的有:
- 源字符串必须以 '\0' 结束。
- 会将源字符串中的 '\0' 拷⻉到⽬标空间。
- ⽬标空间必须⾜够⼤,以确保能存放源字符串。
- ⽬标空间必须可修改。
我们下面来看strcpy函数的实现:
既然我们要将source中的字符串复制到destination中,我们可以创建一个指针存放destination的地址,然后遍历两个字符串进行复制,又由于会将source中的'\0' 一同复制,所以在循环结束后需要再复制一次。
char* my_strcpy(char* dest, const char* str)
{
assert(dest && str);
char* ret = dest;
while (*str)
{
*dest++ = *str++;
}
*dest = *str;
return ret;
}
代码中*dest++=*str++;++的优先级比*高,但是++自增产生的效果是滞后的,也就是说先完成赋值后自增,所以这里不使用()也是可以的。
5.strcat函数的使用和实现
char * strcat ( char * destination, const char * source );
strcat函数作用是完成两个字符串的追加,将source中的字符串追加到destination中。
strcat函数需要注意的有:
- 源字符串必须以 '\0' 结束。
- ⽬标字符串中也得有 \0 ,否则没办法知道追加从哪⾥开始。
- ⽬标空间必须有⾜够的⼤,能容纳下源字符串的内容。
- ⽬标空间必须可修改。
char* my_strcat(char* dest, const char* str)
{
assert(dest && str);
char* ret = dest;
while (*dest)
{
dest++;
}
while (*str)
{
*dest = *str;
}
*dest = *str;
return ret;
}
先找到dest字符串中'\0' 的位置,从此向后进行追加,后面与strcpy的复制部分相同。
6.strcmp函数的使用和实现
int strcmp ( const char * str1, const char * str2 );
对两个字符串进行比较,我们在上一篇文章中的qsort函数中有介绍到strcmp函数,
- ◦ 第⼀个字符串⼤于第⼆个字符串,则返回⼤于0的数字
- ◦ 第⼀个字符串等于第⼆个字符串,则返回0
- ◦ 第⼀个字符串⼩于第⼆个字符串,则返回⼩于0的数字
- ◦ 那么如何判断两个字符串? ⽐较两个字符串中对应位置上字符ASCII码值的⼤⼩。
因为strcmp函数比较的是两个字符串的每个字符的ASCII码值,所以我们可以通过ASCII码的差值来确定两个字符的大小。
int my_strcmp(const char* str1, const char* str2)
{
int ret = 0;
assert(str1 && str2);
while (*str1 == *str2)
{
if (*str1 == '\0')
return 0;
str1++;
str2++;
}
return *str1 - *str2;
}
若当前比较的两个字符相等的话,则比较下两个字符。
我们已经学习完了三个函数,接下来我们看一下这三个函数的“兄弟”
7.strncpy函数的使⽤
char * strncpy ( char * destination, const char * source, size_t num );
我们可以看到,相比strcpy函数,多了一个参数num,这个函数的意思是从source中复制num个字符到destination中。
需要注意的是如果源字符串的⻓度⼩于num,则拷⻉完源字符串之后,在⽬标的后边追加0,直到num个。
8.strncat 函数的使⽤
char * strncat ( char * destination, const char * source, size_t num );
同样的,strnact函数就是从source中向destination中追加num个字符,再追加⼀个 ‘\0’ 字符。
9.strncmp函数的使用
int strncmp ( const char * str1, const char * str2, size_t num );
⽐较str1和str2的前num个字符,如果相等就继续往后⽐较,最多⽐较num个字⺟,如果提前发现不⼀样,就提前结束,⼤的字符所在的字符串⼤于另外⼀个。如果num个字符都相等,就是相等返回0。
这些都是比较常见的字符串函数,当然还有一些不常见的,我们来继续向下学习。
10.strstrr 的使⽤和模拟实现
char * strstr ( const char * str1, const char * str2);
strstr函数的作用是返回字符串str2在字符串str1中第一次出现的位置。
需要注意的是:字符串的⽐较匹配不包含 ‘\0’ 字符,以 ‘\0’ 作为结束标志。
我们来看一个代码,体会一下strstr函数的使用:
#include <stdio.h>
#include <string.h>
int main()
{
char str[] = "This is a simple string";
char* pch;
pch = strstr(str, "simple");
strncpy(pch, "sample", 6);
printf("%s\n", pch);
return 0;
}
我们来分析一下这个代码,代码首先将simple首次出现的位置返回给了pch,随后对pch进行了strncpy带长度的复制,由于simple的长度就是6,所以在复制时没有复制'\0',所以pch的打印结果为 simple string
接下来我们看strstr的实现:
当str2为空字符串时,返回的是str1,所以我们在函数一开始就要判断str2是哪一种。
char* strstr(const char* str1, const char* str2)
{
char* cp = (char*)str1;
char* s1, * s2;
if (!*str2)
return((char*)str1);
while (*cp)
{
s1 = cp;
s2 = (char*)str2;
while (*s1 && *s2 && !(*s1 - *s2))
s1++, s2++;
if (!*s2)
return(cp);
cp++;
}
return NULL;
}
首先判断若str2是空字符串时,返回str1,随后创建变量调整每次进入循环时的位置,若s1与s2当前都不为空字符串且相等时,进入内层循环,继续判断下一个字符是否相等,以此类推,在出内层循环时判断s2是否是空字符串,若是,说明str2在str1中出现,此时cp的位置就是str2首次出现的位置,若s2不为空字符串,说明s1和s2此时不相等或有s1已经遍历完了,则调整cp的位置继续循环。
11. strtok 函数的使⽤
char * strtok ( char * str, const char * sep);
对于strtok函数,它的用法如下:
- sep参数指向⼀个字符串,定义了⽤作分隔符的字符集合
- 第⼀个参数指定⼀个字符串,它包含了0个或者多个由sep字符串中⼀个或者多个分隔符分割的标记。
- strtok函数找到str中的下⼀个标记,并将其⽤ \0 结尾,返回⼀个指向这个标记的指针。(注: strtok函数会改变被操作的字符串,所以在使⽤strtok函数切分的字符串⼀般都是临时拷⻉的内容并且可修改。)
- 当strtok函数的第⼀个参数不为NULL时,函数将找到str中第⼀个标记,strtok函数将保存它在字符串中的位置。
- 当strtok函数的第⼀个参数为 NULL时,函数将在同⼀个字符串中被保存的位置开始(上一次调用函数标记的位置),查找下⼀个标记。
- 如果字符串中不存在更多的标记,则返回 NULL 指针。
我们看下面一个代码来理解会更好一点:
#include <stdio.h>
#include <string.h>
int main()
{
char arr[] = "192.168.6.111";
char* sep = ".";
char* str = NULL;
for (str = strtok(arr, sep); str != NULL; str = strtok(NULL, sep))
{
printf("%s\n", str);
}
return 0;
}
我们先看循环,初始时str被赋值为strtok函数的返回值,也就是数组arr第一次出现 ‘.’ 的位置,循环的条件是str不为NULL,我们根据上面的strtok的用法可以知道,当字符串中不存在给定sep中的标记后,就会返回NULL,而每次strtok函数调用结束后会将返回值赋值给str,当再次调用strtok函数时,就会从上次调用函数对sep中标记出现的地方开始遍历。
接下来来看我们今天要学习的最后一个函数:
12. strerror 函数的使⽤
char * strerror ( int errnum );
我们可以通过代码来打印出来不同错误码对应的错误:
#include <errno.h>
#include <string.h>
#include <stdio.h>
int main()
{
int i = 0;
for (i = 0; i <= 10; i++) {
printf("%s\n", strerror(i));
}
return 0;
}
这是在Windows11+VS2022环境下输出的结果, 打印的分别是0(无错误)和错误码从1到10的每种错误原因,有了这个函数,我们可以确定代码是哪里出了错误,方便我们改正。
在错误这方面还有另一个函数perror,二者的区别我们可以用代码来观察:
#include <stdio.h>
#include <string.h>
#include <errno.h>
int main()
{
FILE* pFile;
pFile = fopen("unexist.ent", "r");
if (pFile == NULL)
printf("Error opening file unexist.ent: %s\n", strerror(errno));
return 0;
}
#include <stdio.h>
#include <string.h>
#include <errno.h>
int main()
{
FILE * pFile;
pFile = fopen("unexist.ent", "r");
if (pFile == NULL)
perror("Error opening file unexist.ent");
return 0;
}
两个代码打印的结果是相同的,perror函数可以直接将错误信息打印出来。perror函数打印完参数部分的字符串后,再打印⼀个冒号和⼀个空格,再打印错误信息。
本章C语言字符函数和字符串函数的学习就先到这里,我们下次再见。