C语言字符函数和字符串函数

最新推荐文章于 2024-10-21 08:29:46 发布

濊繵

最新推荐文章于 2024-10-21 08:29:46 发布

阅读量1.9k

点赞数 54

分类专栏： C语言文章标签： c语言开发语言

本文链接：https://blog.csdn.net/2302_79606537/article/details/138466545

版权

C语言专栏收录该内容

14 篇文章 0 订阅

订阅专栏

今天我们来学习一下C语言中的一些字符函数和字符串函数。在编程的过程中，我们经常要处理字符和字符串，为了⽅便操作字符和字符串，C语⾔标准库中提供了⼀系列库函数，接下来我们就学习⼀下这些函数。

1.字符函数

C语⾔中有⼀系列的函数是专⻔做字符分类的，也就是⼀个字符是属于什么类型的字符的。

这些函数的使⽤都需要包含⼀个头⽂件是<ctype.h>,

函数	如果它的参数符合下列就返回真
iscntrl	任何控制字符
isspace	空白字符：空格' ',换页'\f',换行'\n',回车'\r',制表符'\t'或垂直制表符'\v'
isdigit	十进制数字，'0'~'9'字符
isxdigit	十六进制数字，包括所有十进制数字字符，小写字母a~f,大写字母A~F
islower	小写字母a~z
isupper	大写字母A~Z
isalpha	字母a~z或A~Z
isalnum	字母或者数字a~z,A~Z,0~9
ispunct	标点符号，任何不属于数字或字母的图形字符（可打印）
isgraph	任何图形字符
isprint	任何可打印字符，包括图形字符和空白字符

上述这些函数的使用方式非常相似，所以这里只拿一个函数作为举例：

int islower ( int c );

islower函数是用来判断参数c是否是小写字母，通过返回值来说明是否是⼩写字⺟，如果是⼩写字⺟就返回⾮0的整数，如果不是⼩写字⺟，则返回0。

所以我们可以通过这个函数来实现小写到大写：

#include<stdio.h>
#include<ctype.h>
int main()
{
	char str[] = { "Hello World" };
	char c;
	int i = 0;
	while (str[i])
	{
		c = str[i];
		if (islower(c))
		{
			c -= 32;
		}
		putchar(c);
		i++;
	}
}

因为小写字符和大写字符的ASCII码值相差32，所以小写字符的ASCII码-32就得到对应大写字符的ASCII码值，字符串中的大写字符直接打印，小写字符转化为大写字符再打印。

而对于这种大小写字符的转换，C语言有专门的函数可以使用，让我们来看一下：

2.字符转换函数

int tolower ( int c ); //将参数传进去的⼤写字⺟转⼩写 
int toupper ( int c ); //将参数传进去的⼩写字⺟转⼤写

上⾯的代码，我们将⼩写转⼤写，是-32完成的效果，有了转换函数，就可以直接使⽤ tolower 函

数。

#include<stdio.h>
#include<ctype.h>
int main()
{
	char str[] = { "Hello World" };
	char c;
	int i = 0;
	while (str[i])
	{
		c = str[i];
		if (islower(c))
		{
			c = toupper(c);
		}
		putchar(c);
		i++;
	}
}

首先判断是不是小写字符，若是则通过toupper函数来实现大小写转换，若不是，则可以直接打印。

字符函数我们就先学习到这里，接下来我们来看字符串函数。

3.strlen函数的使用和实现

size_t strlen ( const char * str );

对于strlen函数，需要注意的点有：

字符串以 '\0' 作为结束标志，strlen函数返回的是在字符串中 '\0' 前⾯出现的字符个数（不包含 '\0' )。
参数指向的字符串必须要以 '\0' 结束。

注意函数的返回值为 size_t，是⽆符号的（易错）

strlen的使⽤需要包含头⽂件<sreing.h>

接下来我们来看一下strlen函数的实现：

我们知道strlen函数统计的是对字符串'\0' 前的字符的个数，所以我们首先可以创建一个变量来专门统计字符个数，这也就是第一种方法：

size_t my_strlen(const char* str)
{
	int count = 0;
	assert(str);
	while (*str)
	{
		count++;
		str++;
	}
	return count;
}

那么，如果无法创建临时变量那么应该如何统计字符个数呢？不难发现，strlen函数是一次一次循环直到字符串中出现'\0' ,所以可以把循环写成函数的一种形式：递归。这也是实现strlen函数的第二种方式：

size_t my_strlen(const char* str)
{
	assert(str);
	if (*str == '\0')
	{
		return 0;
	}
	else
	{
		return 1 + my_strlen(str + 1);
	}
}

我们在学习指针的时候学习到了指针-指针的操作，当时说结果是两个指针间的数据个数，所以我们可以使用指针-指针来计算字符个数：

size_t my_strlen(const char* str)
{
	assert(str);
	char* p = str;
	while (*p != '\0')
	{
		p++;
	}
	return p - str;
}

strlen函数先学习到这里，我们来看下一个函数：

4.strcpy函数的使用和实现

char* strcpy(char * destination, const char * source );

strcpy函数的用处是将source的字符串复制到destination中，

strcpy函数需要注意的有：

源字符串必须以 '\0' 结束。
会将源字符串中的 '\0' 拷⻉到⽬标空间。
⽬标空间必须⾜够⼤，以确保能存放源字符串。
⽬标空间必须可修改。

我们下面来看strcpy函数的实现：

既然我们要将source中的字符串复制到destination中，我们可以创建一个指针存放destination的地址，然后遍历两个字符串进行复制，又由于会将source中的'\0' 一同复制，所以在循环结束后需要再复制一次。

char* my_strcpy(char* dest, const char* str)
{
	assert(dest && str);
	char* ret = dest;
	while (*str)
	{
		*dest++ = *str++;
	}
	*dest = *str;
	return ret;
}

代码中*dest++=*str++;++的优先级比*高，但是++自增产生的效果是滞后的，也就是说先完成赋值后自增，所以这里不使用（）也是可以的。

5.strcat函数的使用和实现

char * strcat ( char * destination, const char * source );

strcat函数作用是完成两个字符串的追加，将source中的字符串追加到destination中。

strcat函数需要注意的有：

源字符串必须以 '\0' 结束。
⽬标字符串中也得有 \0 ，否则没办法知道追加从哪⾥开始。
⽬标空间必须有⾜够的⼤，能容纳下源字符串的内容。
⽬标空间必须可修改。

char* my_strcat(char* dest, const char* str)
{
	assert(dest && str);
	char* ret = dest;
	while (*dest)
	{
		dest++;
	}
	while (*str)
	{
		*dest = *str;
	}
	*dest = *str;
	return ret;
}

先找到dest字符串中'\0' 的位置，从此向后进行追加，后面与strcpy的复制部分相同。

6.strcmp函数的使用和实现

int strcmp ( const char * str1, const char * str2 );

对两个字符串进行比较，我们在上一篇文章中的qsort函数中有介绍到strcmp函数，

strcmp函数的标准规定：

◦ 第⼀个字符串⼤于第⼆个字符串，则返回⼤于0的数字
◦ 第⼀个字符串等于第⼆个字符串，则返回0
◦ 第⼀个字符串⼩于第⼆个字符串，则返回⼩于0的数字
◦ 那么如何判断两个字符串？⽐较两个字符串中对应位置上字符ASCII码值的⼤⼩。

因为strcmp函数比较的是两个字符串的每个字符的ASCII码值，所以我们可以通过ASCII码的差值来确定两个字符的大小。

int my_strcmp(const char* str1, const char* str2)
{
	int ret = 0;
	assert(str1 && str2);
	while (*str1 == *str2)
	{
		if (*str1 == '\0')
			return 0;
		str1++;
		str2++;
	}
	return *str1 - *str2;
}

若当前比较的两个字符相等的话，则比较下两个字符。

我们已经学习完了三个函数，接下来我们看一下这三个函数的“兄弟”

7.strncpy函数的使⽤

char * strncpy ( char * destination, const char * source, size_t num );

我们可以看到，相比strcpy函数，多了一个参数num，这个函数的意思是从source中复制num个字符到destination中。

需要注意的是如果源字符串的⻓度⼩于num，则拷⻉完源字符串之后，在⽬标的后边追加0，直到num个。

8.strncat 函数的使⽤

char * strncat ( char * destination, const char * source, size_t num );

同样的，strnact函数就是从source中向destination中追加num个字符，再追加⼀个 ‘\0’ 字符。

如果source 指向的字符串的⻓度⼩于num的时候，只会将字符串中到 ‘\0’ 的内容追加到destination指向的字符串末尾。

我们来看下一个函数：

9.strncmp函数的使用

int strncmp ( const char * str1, const char * str2, size_t num );

⽐较str1和str2的前num个字符，如果相等就继续往后⽐较，最多⽐较num个字⺟，如果提前发现不⼀样，就提前结束，⼤的字符所在的字符串⼤于另外⼀个。如果num个字符都相等，就是相等返回0。

这些都是比较常见的字符串函数，当然还有一些不常见的，我们来继续向下学习。

10.strstrr 的使⽤和模拟实现

char * strstr ( const char * str1, const char * str2);

strstr函数的作用是返回字符串str2在字符串str1中第一次出现的位置。

需要注意的是：字符串的⽐较匹配不包含 ‘\0’ 字符，以 ‘\0’ 作为结束标志。

我们来看一个代码，体会一下strstr函数的使用：

#include <stdio.h>
#include <string.h>
int main()
{
	char str[] = "This is a simple string";
	char* pch;
	pch = strstr(str, "simple");
	strncpy(pch, "sample", 6);
	printf("%s\n", pch);
	return 0;
}

我们来分析一下这个代码，代码首先将simple首次出现的位置返回给了pch，随后对pch进行了strncpy带长度的复制，由于simple的长度就是6，所以在复制时没有复制'\0'，所以pch的打印结果为 simple string

接下来我们看strstr的实现：

当str2为空字符串时，返回的是str1，所以我们在函数一开始就要判断str2是哪一种。

char* strstr(const char* str1, const char* str2)
{
	char* cp = (char*)str1;
	char* s1, * s2;
	if (!*str2)
		return((char*)str1);
	while (*cp)
	{
		s1 = cp;
		s2 = (char*)str2;
		while (*s1 && *s2 && !(*s1 - *s2))
			s1++, s2++;
		if (!*s2)
			return(cp);
		cp++;
	}
	return NULL;
}

首先判断若str2是空字符串时，返回str1，随后创建变量调整每次进入循环时的位置，若s1与s2当前都不为空字符串且相等时，进入内层循环，继续判断下一个字符是否相等，以此类推，在出内层循环时判断s2是否是空字符串，若是，说明str2在str1中出现，此时cp的位置就是str2首次出现的位置，若s2不为空字符串，说明s1和s2此时不相等或有s1已经遍历完了，则调整cp的位置继续循环。

11. strtok 函数的使⽤

char * strtok ( char * str, const char * sep);

对于strtok函数，它的用法如下：

sep参数指向⼀个字符串，定义了⽤作分隔符的字符集合
第⼀个参数指定⼀个字符串，它包含了0个或者多个由sep字符串中⼀个或者多个分隔符分割的标记。
strtok函数找到str中的下⼀个标记，并将其⽤ \0 结尾，返回⼀个指向这个标记的指针。（注： strtok函数会改变被操作的字符串，所以在使⽤strtok函数切分的字符串⼀般都是临时拷⻉的内容并且可修改。）

当strtok函数的第⼀个参数不为NULL时，函数将找到str中第⼀个标记，strtok函数将保存它在字符串中的位置。
当strtok函数的第⼀个参数为 NULL时，函数将在同⼀个字符串中被保存的位置开始（上一次调用函数标记的位置），查找下⼀个标记。
如果字符串中不存在更多的标记，则返回 NULL 指针。

我们看下面一个代码来理解会更好一点：

#include <stdio.h>
#include <string.h>
int main()
{
	char arr[] = "192.168.6.111";
	char* sep = ".";
	char* str = NULL;
	for (str = strtok(arr, sep); str != NULL; str = strtok(NULL, sep))
		{
			printf("%s\n", str);
		}
	return 0;
}

我们先看循环，初始时str被赋值为strtok函数的返回值，也就是数组arr第一次出现 ‘.’ 的位置，循环的条件是str不为NULL，我们根据上面的strtok的用法可以知道，当字符串中不存在给定sep中的标记后，就会返回NULL，而每次strtok函数调用结束后会将返回值赋值给str，当再次调用strtok函数时，就会从上次调用函数对sep中标记出现的地方开始遍历。

接下来来看我们今天要学习的最后一个函数：

12. strerror 函数的使⽤

char * strerror ( int errnum );

strerror 函数可以把参数部分错误码对应的错误信息的字符串地址返回来。

我们先来看一下什么是错误码：

在不同的系统和C语⾔标准库的实现中都规定了⼀些错误码，⼀般是放在 errno.h 这个头⽂件中说明的，C语⾔程序启动的时候就会使⽤⼀个全局的变量errno来记录程序的当前错误码，只不过程序启动的时候errno是0，表⽰没有错误，当我们在使⽤标准库中的函数的时候发⽣了某种错误，就会将对应的错误码，存放在errno中，⽽⼀个错误码的数字是整数很难理解是什么意思，所以每⼀个错误码都是有对应的错误信息的。strerror函数就可以将错误对应的错误信息字符串的地址返回。

我们可以通过代码来打印出来不同错误码对应的错误：

#include <errno.h>
#include <string.h>
#include <stdio.h>
int main()
{
	int i = 0;
	for (i = 0; i <= 10; i++) {
		printf("%s\n", strerror(i));
	}
	return 0;
}

这是在Windows11+VS2022环境下输出的结果，打印的分别是0（无错误）和错误码从1到10的每种错误原因，有了这个函数，我们可以确定代码是哪里出了错误，方便我们改正。

在错误这方面还有另一个函数perror，二者的区别我们可以用代码来观察：

#include <stdio.h>
#include <string.h>
#include <errno.h>
int main()
{
	FILE* pFile;
	pFile = fopen("unexist.ent", "r");
	if (pFile == NULL)
		printf("Error opening file unexist.ent: %s\n", strerror(errno));
	return 0;
}

#include <stdio.h>
#include <string.h>
#include <errno.h>
int main()
{
	FILE * pFile;
	pFile = fopen("unexist.ent", "r");
	if (pFile == NULL)
		perror("Error opening file unexist.ent");
	return 0;
}

两个代码打印的结果是相同的，perror函数可以直接将错误信息打印出来。perror函数打印完参数部分的字符串后，再打印⼀个冒号和⼀个空格，再打印错误信息。

本章C语言字符函数和字符串函数的学习就先到这里，我们下次再见。