文章目录
❤️ 下面要介绍的所有函数,头文件都是<string.h>
一、求字符串长度
1.1strlen
- size_t strlen ( const char * str );
- 返回字符串str的长度C,字符串的长度由 ‘\0’ 确定:C 字符串的长度与字符串开头和 ‘\0’ 之间的字符数一样长(不包括 ‘\0’ 本身)
- 返回值是size_t(无符号的)
模拟实现
count计数法
#include <assert.h>
size_t my_strlen(const char* str)
{
assert(str != NULL);
size_t count = 0;
while (*str++)
{
count++;
}
return count;
}
指针 - 指针
#include <assert.h>
size_t my_strlen(const char* str1)
{
assert(str1 != NULL);
const char* str2 = str1;
while (*str2++)
{
;
}
return str2 - str1 - 1;
}
递归
size_t my_strlen(const char* str)
{
assert(str != NULL);
if (*str)
{
return 1 + my_strlen(str + 1);
}
else
{
return 0;
}
}
二、长度不受限制的字符串函数及改善
2.1 strcpy
- char * strcpy ( char * destination, const char * source ); 复制字符串
- 将源指向的 C 字符串复制到目标指向的数组中,包括终止的’\0
- 源字符串必须以’\0’结束,源字符串里面别放’\0’,不然不知道什么时候停止
- 为避免溢出,目标指向的数组的大小应足够长,以确保能存放源字符串
- 目标空间必须可修改(常量字符串不可修改)
模拟实现
char* my_strcpy(char* dest, const char* stc)
{
char* ret = dest;
assert(dest && stc);
while (*dest++ = *stc++) //先解引用,然后++,但是++是后置++(先使用后增加),
{ //所以就先赋值,++的作用对象是指针
;
}
return ret;
}
int main()
{
char* str = "abcdef";
char ch[20] = { 0 };
char* ret = my_strcpy(ch, str);
printf("%s", ret);
return 0;
}
2.2 strcat
- char * strcat ( char * destination, const char * source ); 追加字符串
- 追加的字符串必须以 ‘\0’ 结束(不然不知道什么时候停止)
- 会把 ‘\0’ 也拷贝进去
- 目标空间必须足够大,以便容纳下追加字符串的内容
- 目标空间必须可修改
- 字符串不能自己给自己追加(会把字符串中的‘\0’干掉)
模拟实现
#include <stdio.h>
#include <assert.h>
char* my_strcat(char* ch, const char* str)
{
assert(ch && str);
char* ret = ch;
while (*ch != '\0')
{
ch++;
}
while (*ch++ = *str++)
{
;
}
return ret;
}
int main()
{
char ch[20] = "abcdef";
char str1[20] = "ghsjd";
my_strcat(ch, str1);
printf("%s", ch);
return 0;
}
2.3 strcmp
- int strcmp ( const char * str1, const char * str2 ); 比较两个字符串
- 比较大小是一个一个字符地比,比的是对应字符ASCII的大小
- 返回值
- 第一个字符串大于第二个字符串,则返回大于0的数字
- 第一个字符串等于第二个字符串,则返回0
- 第一个字符串小于第二个字符串,则返回小于0的数字
- VS环境下,第一种情况就返回1,第三种情况就返回-1,但是为了避免意外,尽量不要把判等条件设为==-1、==1,而是>0、<0
模拟实现
int my_strcmp(const char* str1, const char* str2)
{
int ret = 0;
assert(str1 && str2);
while (*str1 == *str2)
{
if (*str1 == 0)
{
return 0;
}
str1++;
str2++;
}
if (*str1 > *str2)
{
return 1;
}
else if (*str1 < *str2)
{
return -1;
}
}
int main()
{
char str1[20] = "abcdef";
char str2[20] = "acefdj";
int ret = my_strcmp(str1, str2);
printf("%d", ret);
return 0;
}
相减取反
int my_strcmp(const char* str1, const char* str2)
{
int ret = 0;
assert(str1 != NULL);
assert(str2 != NULL);
while (!(ret = *(unsigned char*)str1 - *(unsigned char*)str2) && *str1)
++str1, ++str2;
if (ret < 0)
ret = -1;
else if (ret > 0)
ret = 1;
return(ret);
}
int main()
{
char str1[20] = "abcdef";
char str2[20] = "acefdj";
int ret = my_strcmp(str1, str2);
printf("%d", ret);
return 0;
}
strcpy、strcat、strcmp 总结
strcpy、strcat、strcmp(长度不受限制的字符串函数),拷贝结束依据’\0’,不会考虑目标空间是否放得下,具有一定的安全问题
解决方法:strncpy、strncat、strncmp,与上面的三个函数相比,变化是以第几个数字作为结束标志
2.4 strncpy、strncat、strncmp
- char * strncpy ( char * destination, const char * source, size_t num ); 复制字符串
- char * strncat ( char * destination, const char * source, size_t num ); 追加字符串
- 在追加之后会放上一个‘\0’,因为本身还是一个字符串
- int strncmp ( const char * str1, const char * str2, size_t num ); 比较字符串大小
- num的类型是size_t
- 模拟实现方面,就是for循环控制字数
三、字符串查找
3.1 strstr
- char * strstr ( const char *, const char * ); 查找子字符串
- 返回指向 str2 中第一次出现的 str1 的指针,如果 str2 不是 str1 的一部分,则返回一个空指针。
- 匹配过程不包括终止空字符,但它到此为止。
模拟实现
char* my_strstr(const char* str1, const char* str2)
{
assert(str1 && str2);
if (*str2 == '\0')
{
return (char*)str1;
}
const char* s1 = NULL;
const char* s2 = NULL;
const char* cp = str1;
while (*cp)
{
s1 = cp;
s2 = str2;
while (*s1 !='\0' && *s2!='\0' && *s1 == *s2)
{
s1++;
s2++;
}
if (*s2 == '\0')
{
return (char*)cp;
}
cp++;
}
return NULL;
}
int main()
{
char arr1[] = "abbbcdbbcef";
char arr2[] = "bbc";
char* ret = my_strstr(arr1, arr2);
if (ret == NULL)
{
printf("找不到\n");
}
else
{
printf("%s\n", ret);
}
return 0;
}
3.2 strtok
- char * strtok ( char * str, const char * delimiters );将字符串拆分为标记
- sep参数是个字符串,定义了用作分隔符的字符集合
- 第一个参数指定一个字符串,它包含了0个或者多个由sep字符串中一个或者多个分隔符分割的标记。
- strtok函数找到str中的下一个标记,并将其用 \0 结尾,返回一个指向这个标记的指针。(注:
strtok函数会改变被操作的字符串,所以在使用strtok函数切分的字符串一般都是临时拷贝的内容并且可修改。) - strtok函数的第一个参数不为 NULL ,函数将找到str中第一个标记,strtok函数将保存它在字符串中的位置。
- strtok函数的第一个参数为 NULL ,函数将在同一个字符串中被保存的位置开始,查找下一个标记。
- 如果字符串中不存在更多的标记,则返回 NULL 指针。
模拟实现
int main()
{
char arr[] = "192#168.120.85";
char* p = "#.";
char buf[20] = { 0 };
strcpy(buf, arr);
char* ret = NULL;
for (ret = strtok(buf, p); ret != NULL; ret=strtok(NULL, p))
{
printf("%s\n", ret);
}
return 0;
}
四、错误信息报告
4.1 sterror
- char * strerror ( int errnum ); 返回错误码所对应的错误信息的字符串的首元素地址
- 错误码
- C语言的库函数在运行的时候,如果发生错误,就会将错误码存在一个全局变量中,这个变量是errno。
- 错误码在形式上是一些数字,如1,2,3,4,5……,但是仅仅是数字是没有用处的,我们需要将错误码转为错误信息,从而进行代码上的修改
- 错误码
- 头文件:<strig.h> + <errno.h>
#include <stdio.h>
#include <string.h>
#include <errno.h>//必须包含的头文件
int main()
{
FILE* pFile;
pFile = fopen("unexist.ent", "r"); //r表示以读的形式打开
if (pFile == NULL)
printf("Error opening file unexist.ent: %s\n", strerror(errno));
perror("fopen");
//errno: Last error number
return 0;
}`
fopen
//打开里面的文件,打开成功,返回有效指针(非空指针),打开失败返回空指针
//如果没有设置路径,就在本项目内部寻找
perror 打印错误信息
//perror是直接打印错误信息,在打印错误信息前,会先打印自定义的信息,如
strerror 访问存放错误码的全局变量error
//可以捕获多个错误码(错误码按顺序排列)
五、字符操作
5.1 字符分类函数(为真返回非0值)
- iscntrl 检查字符是否为控制字符
- int iscntrl ( int c );
- 控制字符是不占据显示器上打印位置的字符(这与可打印字符相反,使用 isprint 进行检查)
- isspace 检查字符是否为空格(空白字符)
- int isspace ( int c );
- 空白字符:空格‘ ’、换页‘f’、换行‘\n’、回车’r’、制表符‘\t’或垂直制表符’\v’
- isdigit 检查字符是否为十进制数字(0-9)
- int isdigit ( int c );
- isxdigit 检查字符是否为十六进制数字
- int isxdigit ( int c );
- 十六进制数字,包括所有十进制数字,小写字母a-f,大写字母A-F
- islower 检查字符是否为小写字母a-z
- int islower ( int c );
- isupper 检查字符是否为大写字母A-Z
- int islower ( int c );
- isalpha 检查字符是否为字母(a-z或A-Z)
- int isalpha ( int c );
- isalnum 检查字符是否为字母(a-z或A-Z)或数字(0-9)
- int isalnum ( int c );
- ispunct 检查字符是否为标点符号
- int ispunct ( int c );
- 标点符号为不属于任何数字或者字母的可打印的圆形字符
- isgraph 检查字符是否具有图形表示
- int graph ( int c );
- 具有图形表示的字符是除空格字符 (’ ') 之外的所有可以打印的字符(由 isprint 确定)。
- isprint 检查字符是否可打印
- int print ( int c );
- 可打印字符包括图形字符和空白字符
5.2 字符转换
- tolower 将大写字母转换为小写字母
- int tolower ( int c );
#include <stdio.h>
#include <ctype.h>
int main ()
{
int i=0;
char str[]="Test String.\n";
char c;
while (str[i])
{
c=str[i];
putchar (tolower(c)); //输出:test string.
i++;
}
return 0;
}
- toupper 将小写字母转换为大写字母
- int toupper ( int c );
#include <stdio.h>
#include <ctype.h>
int main ()
{
int i=0;
char str[]="Test String.\n";
char c;
while (str[i])
{
c=str[i];
putchar (toupper(c)); //TEST STRING.
i++;
}
return 0;
}
六、内存操作函数
6.1 memcpy
- void * memcpy ( void * destination, const void * source, size_t num ); 拷贝函数
- num指的是要拷贝的字节数
- 作用:函数memcpy从source的位置开始向后复制num个字节的数据到destination的内存位置。
- 特点:
- 这个函数拷贝时适用于各种类型,strcmp则只能拷贝字符串
- 这个函数在遇到 ‘\0’ 的时候并不会停下来。
- 如果source和destination有任何的重叠,复制的结果都是未定义的。(因为会发生重叠使得数据改变)
模拟实现
void* memcpy(void* dst, const void* src, size_t count)
{
void* ret = dst;
assert(dst && src);
while (count--)
{
*(char*)dst = *(char*)src;
dst = (char*)dst + 1; //++(char*)dst
src = (char*)src + 1; //++(char*)src
}
return(ret);
}
✨这里为什么不能用后置++?
因为按照操作符的顺序来看,++比(类型)先使用,所以++操作的对象还是void*类型的
而如果是前置++,虽然++的顺序依旧比(类型)前,但是会采用就近原则,即先进行类型的转换
6.2 memove
- void * memmove ( void * destination, const void * source, size_t num ); 拷贝函数
- 和memcpy的差别就是memmove函数处理的源内存块和目标内存块是可以重叠的。
- 如果源空间和目标空间出现重叠,就得使用memmove函数处理。
- VS环境下已经把库里面memove和memcpy改成一样了,但为了避免编译器不同环境的影响下,建议分开使用
模拟实现
void* my_memmove(void* dest, const void*src, size_t num)
{
void* ret = dest;
assert(dest && src);
if (dest < src)
{
//前-->后
while (num--)
{
*(char*)dest = *(char*)src;
dest = (char*)dest + 1;
src = (char*)src + 1;
}
}
else
{
//后->前
while (num--)
{
*((char*)dest+num) = *((char*)src + num);
}
}
return ret;
}
6.3 memset
- void * memset ( void * ptr, int value, size_t num ); 内存设置函数
- 以字节为单位设置内存中的数据
- ptr(指向要填充的内存块的指针),该函数返回的也是这个
#include <stdio.h>
#include <string.h>
int main ()
{
char str[] = "almost every programmer should know memset!";
memset (str,'-',6);
puts (str);
return 0;
}
6.4 memcmp
- int memcmp ( const void * ptr1, const void * ptr2, size_t num ); 比较两个内存块
- 比较从ptr1和ptr2指针开始的num个字节
- 返回值