目录
字符函数和字符串函数
求字符串长度:strlen
长度不受限的字符串函数:strcpy、strcat、strcmp
长度受限的字符串函数:strncpy、strncat、strncmp
字符串查找:strstr、strtok
错误信息报告:strstr
字符操作:如下述讲解
这些字符函数和字符串函数使用时需要包含头文件string.h
内存操作函数
memcpy、memmove、memset、memcmp
C语言本身没有字符串类型,字符串通常放在常量字符串中或者字符型数组中
字符串常量适用于那些对它不做修改的字符串函数
1.库函数strlen及其模拟实现
库函数strlen:求字符串长度
注:
- 字符串以'\0'作为结束标志,strlen函数返回的是在字符串中'\0'前面出现的字符个数
- 参数指向的字符串必须以'\0'结束
- 注意函数的返回值为size_t类型,即无符号整数
例1:
字符串"abcdef",实际上是"abcdef\0",strlen计算的是'\0'前字符的个数,所以输出6
例2:
strlen("abc") = 3,strlen("abcdef") = 6
3-6 = -3 < 0,按道理应该输出<,但是这里输出>
对于strlen函数,它的返回值是一个unsigned int(无符号整数),两个无符号整数相减得到的数认为无符号整数,所以编译器会把-3当作一个无符号整数(一个很大的正数),正数>0,所以最终输出>
因此使用strlen函数时应当避免这种情况,使用strlen("abc") > strlen("abcdef")代替
strlen函数的模拟实现(计数法,指针-指针法,递归法)
1️⃣计数法
分析:char arr[ ] = "abcdef";
计算字符串"abcdef\0"的长度,即计算'\0'前字符个数
定义一个变量count,初始化为0,用来存放字符个数
我们知道数组名 代表数组首元素的地址,即arr指向字符a,*arr就是字符a
当我们访问到的字符 != '\0'时,count++,arr++,这应该是一个循环
直到访问到的字符时'\0'时,跳出循环,返回count
计数法实现
#include<stdio.h>
#include<assert.h>
size_t my_strlen(const char* str)
{
assert(str);//断言,指针为空则报错
size_t count = 0;
while (*str != '\0')
{
count++;
str++;
}
return count;
}
int main()
{
char arr[] = "abcdef";
size_t ret = my_strlen(arr);
printf("%d\n", ret);
return 0;
}
2️⃣指针减指针法
我们已经直到指针-指针就是俩个指针之间字符的个数
可以发现字符串的长度就是指向字符'\0'的指针-指向字符串首字符的指针
指针-指针法实现:
#include<stdio.h>
#include<assert.h>
size_t my_strlen(const char* str)
{
assert(str);//断言,指针为空则报错
char* begain = str;
while (*str != '\0')
{
str++;
}
//执行到这里,str已经指向了'\0'
return str - begain;
}
int main()
{
char arr[] = "abcdef";
size_t ret = my_strlen(arr);
printf("%d\n", ret);
return 0;
}
3️⃣递归法
分析:char arr[ ] = "abcdef";假设my_strlen可以计算字符串长度
字符串长度 = my_strlen("abcdef")
字符串长度 = 1 + my_strlen("bcdef")
字符串长度 = 1 + 1 + my_strlen("cdef")
字符串长度 = 1 + 1 + 1 + my_strlen("def")
字符串长度 = 1 + 1 + 1 + 1 + my_strlen("ef")
字符串长度 = 1 + 1 + 1 + 1 + 1 + my_strlen("f")
字符串长度 = 1 + 1 + 1 + 1 + 1 + 1 = 6
可以发现:字符串长度 = 1 + 指针+1后指向的字符串长度;当str != '\0'时,字符串的长度 = 0;所以把'\0'单独区分,当str = '\0'时,返回0;当当str != '\0'时,返回1+指针+1后指向的字符串长度
递归法实现:
#include<stdio.h>
#include<assert.h>
size_t my_strlen(const char* str)
{
assert(str);
while (*str == '\0')
{
return 0;
}
//str != '\0'
str++;
return 1 + my_strlen(str);
}
int main()
{
char arr[] = "abcdef";
size_t ret = my_strlen(arr);
printf("%d\n", ret);
return 0;
}
2.库函数strcpy及其模拟实现
strcpy:字符串拷贝
注:
- 源字符串必须以'\0'结束
- 会将源字符串的'\0'拷贝到目标空间,并在拷贝'\0'之后停止
- 目标空间必须足够大,以确保能容纳源字符串,不会造成数组越界访问
- 目标空间必须可变,不使用const修饰
例:
一些错误示例:
分析:数组名代表数组首元素地址,地址是一个常量值,不能被赋值
字符串拷贝应该使用库函数strcpy
分析:源字符串必须以'\0'结束,否则会导致内存访问出错
目标空间必须是可修改的空间,常量字符串不可修改
strcpy函数模拟实现
分析:char arr1[ ] = "abcdef"; char arr2[30] = { 0 };
把arr1中的字符串拷贝到arr2数组中
按字符依次拷贝
arr1指向"abcdef"的首字符,首先将首字符拷贝到arr2中
arr1++,指向第二个字符,拷贝
... ...
当 *arr1 == '\0' 时,拷贝'\0'并在该处停止
实现:
#include<stdio.h>
#include<assert.h>
char* my_strcpy(char* des, const char* src)
{
assert(des && src);
char* tmp = des;
while (*src != '\0')
{
*des = *src;
des++;
src++;
}
//拷贝空字符
*des = *src;
return tmp;
}
int main()
{
char arr1[] = "abcdef";
char arr2[30] = { 0 };
my_strcpy(arr2, arr1);
printf("%s\n", arr2);
return 0;
}
3.库函数strcat及其模拟实现
strcat:字符串追加
注:
- 源字符串必须以'\0'结束
- 目标空间必须足够大,能容纳下源字符串的内容
- 目标空间必须可修改
- 字符串不能自身追加
例:字符串"hello \0"
自身追加使源字符串末尾的\0被覆盖,导致追加不能遇到字符'\0'而停下
例:
strcat函数模拟实现
分析:
字符串追加,应该先找到目标字符串的结束标志即'\0'的位置,从这个位置开始追加即可
追加结束,得到新的字符串末尾包含一个空字符
实现:
#include<stdio.h>
#include<assert.h>
char* my_strcat(char* des, const char* src)
{
assert(des && src);
char* tmp = des;
//找到目标空间的'\0',即追加起始位置
while (*des != '\0')
{
des++;
}
//des指向源字符串的末尾'\0'
while (*src != '\0')
{
*des = *src;
des++;
src++;
}
//追加空字符
*des = *src;
return tmp;
}
int main()
{
char arr1[30] = "hello ";
char arr2[] = "world";
my_strcat(arr1, arr2);
printf("%s\n", arr1);
return 0;
}
4.库函数strcmp及其模拟实现
strcmp:字符串拷贝
注:
- 比较是一对一对地比较字符的ASCII码值
例:
strcmp函数模拟实现
分析:
我们需要从首字符开始一对一对地比较字符的ASCII值
当字符的ASCII码值相等时,继续比较下一对字符
直到俩字符不相等或者遇到字符串结束标志'\0'时停止比较
综上所述:
我们需要一个循环结构实现
#include<stdio.h>
#include<assert.h>
char* my_strcmp(const char* str1, const char* str2)
{
assert(str1 && str2);
while (*str1 == *str2)
{
//*str1 == '\0' == *str2
//两个长度相同的字符串结束结束了都没有比出大小,说明这俩个串一样大
if (*str1 == '\0')
{
return 0;
}
str1++;
str2++;
}
//程序运行到这里说明*str1 != *str2
//两个字符的ASCII码值比较
if (*str1 > *str2)
{
return 1;
}
else
{
return -1;
}
}
int main()
{
char arr1[] = "zhangsan ";
char arr2[] = "zhangsanfeng";
my_strcmp(arr1, arr2);
printf("%s\n", arr1);
return 0;
}
5.库函数stncpy,strncat,strncmp
strncpy:长度受限制的字符串拷贝函数
注:
- 当源字符串的大小小于num时,先把源字符串拷贝到目标中,剩余不够的填充0,直到拷贝的字符个数达到num个
- 当源字符串的大小大于num时,拷贝完成后,目标字符串的末尾不会填充字符串结束标志'\0',
strncat:长度受限制的字符串追加函数
注:
- 当源字符串的大小小于num时,只拷贝源字符串'\0'之前的内容
- 拷贝完成后,目标字符串的末尾会填充字符串结束标志'\0',
strncmp:长度受限制的字符串比较函数
6.库函数strstr及其模拟实现
strstr:查找子串
strstr函数模拟实现
分析:查找字串的两种情况
情况一:
str1:abcdef
str2:bcd
情况二:
str1:abbbcdef
str2:bbc
可以发现,这种情况当我们的首字符匹配成功后,后续的字符不能匹配成功,这就需要从首字符匹配成功的下一个字符重新进行匹配
实现:
#include<stdio.h>
#include<assert.h>
char* my_strstr(const char* str1, const char* str2)
{
assert(str1 && str2);
//字串未结束
while (*str2 != '\0')
{
//首字符未匹配成功
while (*str1 != *str2)
{
//源字符串未结束
if (*str1 != '\0')
str1++;
else
return NULL;
}
//程序运行到这里说明*str1 == *str2,首字符匹配成功
char* ret1 = str1;
char* ret2 = str2;
while (*++str1 == *++str2)
;//空语句,循环条件是相等比较下一对
//子串结束,匹配成功
if (*str2 == '\0')
return ret1;
//子串未结束,匹配失败,从上一次首字符匹配成功大的下一个字符重新开始匹配
else
{
str1 = ret1 + 1;
str2 = ret2;
}
}
}
int main()
{
char arr1[] = "abbbcdef";
char arr2[] = "bbc";
char* ret = my_strstr(arr1, arr2);
if (ret == NULL)
{
printf("子串未找到\n");
}
else
{
printf("%s\n", ret);
}
return 0;
}
7.库函数strtok
strtok:切割字符串函数
这个函数的说明比较复杂,我们通过举例讲解
注:
- 在第一次调用时,该函数需要一个C字符串作为函数的第一个参数,函数将找到str中的第一个标记,保存他在字符串中的位置
- 在后续调用中,该函数需要一个空指针,函数将在同一个字符串中被保存的位置开始寻找下一个标记
- 如果字符串中不存在更多的标记,则函数返回NULL
- 一旦在对 strtok 的调用中找到 str 的终止空字符,则对此函数的所有后续调用(以空指针作为第一个参数)都将返回空指针。
例:
char email[] = "zhangsan@xupt.com";
char* sep = "@.";//分隔符的集合char* ret = strtok(email, sep);
给函数第一个参数传参为C字符串,不为NULL,函数将寻找email字符串中的第一个标记'@',找到后置这个标记为'\0',返回指向字段zhangsan首字符的指针,且调用结束后,记忆@的位置
strtok函数会修改源字符串的内容,所以我们使用时需要对源字符串进行临时的拷贝
ret = strtok(NULL, sep);
函数的第一个参数为NULL,表示函数将在email字符串中查找下一个标记'.',查找的起始位置为记忆的'@'字符的下一个位置,找到后置这个标记为'\0',并返回指向xupt这个字段首字符的指针,且调用结束后,记忆'.'的位置
ret = strtok(NULL, sep);
函数的第一个参数为NULL,表示函数将在email字符串中查找下一个标记,查找的起始位置为记忆的'.'字符的下一个位置,查找过程中,找到了源字符串的结束标志,返回指向com这个字段首字符的指针
在对strtok的调用中找到字符串的终止空字符,则对此函数的所有后续调用(以空指针作为第一个参数)都将返回空指针。
8.库函数strerror
strerror:返回错误码对应的错误信息
C语言的库函数在执行失败时,都会设置错误码
举例:
9.字符分类函数
使用字符分类函数的头文件#include<ctype.h>
函数 | 如果它的条件参数符合下列条件就返回真 |
iscntrl | 任何控制字符 |
isspace | 空白字符:空格' ',换页'\f',换行'\n',回车'\r',制表符'\t',垂直制表符'\v' |
isdigit | 十进制数字0~9 |
isxdigit | 十六进制数字0~9,小写字母a~f,大写字母A~F |
islower | 小写字母a~z |
isupper | 大写字母A~Z |
isalpha | 小写字母a~z或大写字母A~Z |
isalnum | 字母或数字:a~z,A~Z,0~9 |
ispunct | 标点符号,任何不属于数字/字母的图形字符(可打印) |
isgraph | 任何图形字符 |
isprint | 任何可打印字符,包括图形字符和空白字符 |
使用举例:
isdigit('0') ; 返回一个非0数
isdigit('w') ; 返回0
10.字符转换函数
函数 | 功能 |
tolower | 把大写字母转换成小写字母 |
toupper | 把小写字母转换成大写字母 |
注:当传给tolower/toupper一个非字母参数时,函数不会的字符做出任何操作
例:
tolower('A') ; ==> a
toupper('z') ; ==> Z
tolower('@'); ==> @
11.库函数memcpy及其模拟实现
memcpy:内存拷贝
对于strcpy和strncpy这样的库函数,它们的作用对象为字符串,不能拷贝其他类型的数据
对于memcpy这样的函数,它的参数为泛型指针,具有通用性
举例:整型数据的复制:
浮点型数据的复制:
size_t num;num是要复制的字节数
对于momcpy函数,自身拷贝会出现错误,memcpy负责拷贝两块独立空间中的数据,重叠内存的拷贝使用memmove
memcpy函数模拟实现
分析:
对于memcpy函数,参数为void* 类型,可以实现不同类型数据的复制,并且是按字节复制数据,解决了复制类似17byte,19byte等不是某个类型字节大小的整数倍的是数据
我们已经知道,对于void*类型的数据,我们不能直接进行解引用操作,需要先强制类型转换
这里我们是按字节进行复制,所以因该强制类型转换为(char*)类型,以实现按字节进行操作
实现:
#include<stdio.h>
#include<string.h>
#include<assert.h>
void* my_memcpy(void* des, const void* src, size_t num)
{
assert(des && src);
void* ret = des;//存储des的初始位置
while (num--)
{
*(char*)des = *(char*)src;
des = (char*)des + 1;
src = (char*)src + 1;
}
return ret;
}
int main()
{
float arr1[] = { 1.0,2.5,3.6,4.9,5.1 };
float arr2[10] = { 0 };
my_memcpy(arr2, arr1, 20);
int i = 0;
for (i = 0; i < 5; i++)
{
printf("%.1f ", arr2[i]);
}
return 0;
}
des = (char*)des + 1;
src = (char*)src + 1;这里不能使用src = (char*)src++
原因是(char*)是临时变量,编译器可能会报错
12.库函数memmove及其模拟实现
memmove:内存拷贝
在VS编译器中,memmove可以实现重叠内存的拷贝
注:memmove和memcpy实现的功能即函数参数都相同,不同的地方在于memmove 可以实现内存重叠数据的复制
memmove函数的模拟实现
分析:
memmove函数的模拟实现主要实现内存重叠数据的复制
对于一个数组arr1 = {1,2,3,4,5,6,7,8,9,10}
- 把1,2,3,4,5复制到3,4,5,6,7的位置,最终数组为1,2,1,2,3,4,5,8,9,10
可以发现,从前向后复制不能实现我们想要的效果,在内存重叠的部分,我们修改后续值时,源内存块的值已被修改
当从后向前复制时,可以实现最终的效果
- 把3,4,5,6,7复制到的1,2,3,4,5位置,最终数组为3,4,5,6,7,6,7,8,9,10
可以发现,从前向后复制就可以实现
注:以上所述的从前向后和从后向前均指从源位置的起始位置还是末尾位置开始复制
总结:当des<src时,从前向后复制;当des>src时,从后向前复制
实现:
#include<stdio.h>
#include<string.h>
#include<assert.h>
void* my_memmove(void* des, const void* src, size_t num)
{
assert(des && src);
void* ret = des;//存储des的初始位置
//从前向后复制
if (des < src)
{
//按字节复制
while (num--)
{
*(char*)des = *(char*)src;
des = (char*)des + 1;
src = (char*)src + 1;
}
}
//从后向前复制
else
{
//src和des都指向要复制的最后一个字节
des = (char*)des + num - 1;
src = (char*)src + num - 1;
while (num--)
{
*(char*)des = *(char*)src;
des = (char*)des - 1;
src = (char*)src - 1;
}
}
return ret;
}
int main()
{
int arr[10] = { 1,2,3,4,5,6,7,8,9,10 };
my_memmove(arr + 2, arr, 20);
int i = 0;
for (i = 0; i < 10; i++)
{
printf("%d ", arr[i]);
}
return 0;
}
13.库函数memcmp
memcmp:内存块比较
注:与 strcmp 不同,该函数在找到空字符后不会停止比较,函数只会在比出大小或者比完num个字节数之后返回。
举例:
14.库函数memset
memset:内存设置
举例:更改字符串
整型数组初始化:
可以将一个整型数组中每个元素的每一个字节初始化为1