字符串和字符串函数详解及模拟实现

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

一、函数介绍及模拟实现

C语言中对字符和字符串的处理很是频繁,但是C语言本身是没有字符串类型的,字符串通常放在常量字符串 中或者 字符数组 中。
字符串常量 适用于那些对它不做修改的字符串函数。
库函数在模拟实现的时候其中的参数返回类型则需要与标准库中函数类型保持一致。
c语言库函数标准字典网站:https://legacy.cplusplus.com

1.求字符串长度

strlen

size_t strlen ( const char * str );
  • 字符串已经 ‘\0’ 作为结束标志,strlen函数返回的是在字符串中 ‘\0’ 前面出现的字符个数(不包含 ‘\0’ )。
  • size_t strlen ( const char * str );
  • 参数指向的字符串必须要以 ‘\0’ 结束。
  • 注意函数的返回值为size_t,是无符号的。
  • 注意事项:strlen是求字符串长度的,求出的长度不可能为负数的,所以返回类型size_t。
#include <stdio.h>
#include <string.h>
int main()
{
    const char* str1 = "abcdef";//字符串长度为6
    const char* str2 = "abc";//字符串长度为3
    //3-6=-3由于strlen返回的是size_t类型的无符号整数,所以打印的是str2>str1
    if (strlen(str2) - strlen(str1) > 0)
    {
        printf("str2>str1\n");
    }
    else
    {
        printf("srt1>str2\n");
    }
    return 0;
}

模拟strlen的三种方法:

#include<stdio.h>
#include<string.h>
#include<assert.h>
//1.使用计数器方法,数组没遇到'\0'之前,count++
int my_strlen(const char* str)
{
    int count = 0;
    while (*str!='\0')
    {
        count++;
        str++;
    }
    return count;
}

//2.递归
int my_strlen(const char* str)
{
    assert(str!=NULL);
    if (*str != '\0')
    {
        return 1 + my_strlen(str + 1);//数组的首元素字符+(str+1)指向的后面的字符
    }
    else
    {
        return 0;//第一个字符'\0'返回值0
    }
}

//3.指针-指针 指针相减返回元素个数
int my_strlen(const char* str)
{
    const char* start = str;
    assert(str != NULL);
    while (*str!='\0')
    {
        str++;
    }
    return str - start;
}

int main()
{
    char arr[] = "hello world";
    int ret = my_strlen(arr);
    printf("%d\n", ret);
    return 0;
}

2.长度不受限制的字符串函数

strcpy

char* strcpy(char * destination, const char * source );
  • 源字符串必须以 ‘\0’ 结束。
  • 会将源字符串中的 ‘\0’ 拷贝到目标空间。
  • 目标空间必须足够大,以确保能存放源字符串。
  • 目标空间必须可变。
//模拟实现
#include<stdio.h>
#include<string.h>
#include<assert.h>
char *my_strcpy( char* dest, const char* src)//原数据不需要被修改
{
	char* ret = dest;//保留目标空间的起始地址
	assert(dest && src);
	while (*dest=*src)
	{
		dest++;//dest++最终指向的不再是dest的起始地址
		src++;
	}
	return ret;//返回目标空间的起始地址,返回类型则为char *
}
int main()
{
	char arr1[50] = "";
	char arr2[] = "abcdef";
	my_strcpy(arr1, arr2);
	printf("%s\n", arr1);
	return 0;
}

strcat

char * strcat ( char * destination, const char * source );
  • 源字符串必须以 ‘\0’ 结束。
  • 目标空间必须有足够的大,能容纳下源字符串的内容。
  • 目标空间必须可修改。
#include<stdio.h>
#include<string.h>
#include<assert.h>
char *my_strcat(char* dest, const char* str)
{
	assert(dest && str);
	char* ret = dest;
	while (*dest != '\0')
	{
		dest++;//找到目标空间的'\0'
	}
	while (*dest=*str)//追加
	{
		dest++;
		str++;
	}
	return ret;
}
int main()
{
	char arr[50] = "hello";
	my_strcat(arr, "world");
	printf("%s\n", arr);
}

strcmp

int strncmp ( const char * str1, const char * str2, size_t num );
  • 两个字符串相比较,比较的是ASCII码值的大小,根据大小判断返回值
  • 标准规定:
    第一个字符串大于第二个字符串,则返回大于0的数字
    第一个字符串等于第二个字符串,则返回0
    第一个字符串小于第二个字符串,则返回小于0的数字
//strcmp模拟实现
#include<stdio.h>
#include<string.h>
#include<assert.h>
int my_strcmp(const char* str1, const char* str2)
{
	assert(str1 && str2);
	while (*str1==*str2)
	{
		if (*str1 == '\0')//由于循环条件判断str1和str2相等,所以只需要判断str1或者str2一个为'\0',则两个字符串相等
		{
			return 0;
		}
		str1++;
		str2++;
	}
	if (*str1 > *str2)
	{
		return 1;
	}
	else
	{
		return -1;
	}
}
main()
{
	char arr1[] = "abc";
	char arr2[] = "ab";
	int ret=my_strcmp(arr1, arr2);
	printf("%d\n", ret);
}

3.长度受限制的字符串函数介绍

  • 不受限制的字符串函数:函数不安全:目标空间不够大

strncpy

char * strncpy ( char * destination, const char * source, size_t num );
  • 当要拷贝的字节数大于源字符串时:超出字节数的补\0
  • 当要拷贝的字符串长度小于num,则拷贝完源字符串之后,在目标的后面追加\0,直到n个

int main()
{
  char arr[20]="xxxxxxxxxx";
  char arr[]="hello";
  strncpy(arr,"hello",5);
  printf("%s\n",arr);
}
//模拟实现
#include<stdio.h>
#include<string.h>
#include<assert.h>
char* my_strncpy(char* dest, const char* src, size_t num)
{
	assert(dest && src);
	char *ret= dest;
	while ((num>0)&&(*src!='\0'))
	{
		*dest++ = *src++;
		num--;
	}
	if (num > 0)//判断num>0,如果是则要拷贝的字符个数大于源字串长度,目标空间填'\0'
	{
		while (num--)
		{
			*dest++ = '\0';
		}
	}
	return ret;
}
main()
{
	char arr1[20] = "xxxxxxxxxx";
	char arr2[] = "hello";
	my_strncpy(arr1, arr2, 4);
	printf("%s", arr1);
}

strncat

char * strncat ( char * destination, const char * source, size_t num );
  • 当追加的字符串长度大于或小于源字符串长度时,追加源字符串位置停止追加,追加结束后会存放’\0’,最终还是一个字符串。
  • 追加时是从目标空间的’\0’开始,追加结束后会存放’\0’
//模拟实现
#include<stdio.h>
#include<string.h>
#include<assert.h>
char* my_strncat(char* dest,char* str, size_t num)
{
	assert(dest && str);
	char* ret = dest;
	while (*dest!='\0')
	{
		dest++;
	}
	while ((num!=0) && (*dest = *str))
	{	
		num--;
		dest++;
		str++;
	}
	*dest = '\0';//拷贝完后,dest指向的位置是拷贝结束的下一个位置,在此补上'\0'结束
	return ret;
}

int main()
{
	char arr1[50] = "xxxxx\0xxxxxxxxxxxxxx";
	char arr2[5] = "world";
	my_strncat(arr1,arr2, 3);
	printf("%s\n", arr1);
}

strncmp

int strncmp ( const char * str1, const char * str2, size_t num );

比较到出现另个字符不一样或者一个字符串结束或者num个字符全部比较完。

在这里插入图片描述

#include<stdio.h>
#include<string.h>
#include<assert.h>
int my_strncmp(const char* str1, const char* str2, size_t num)
{
	assert(str1 && str2);
	while ((--num!=0)&&(*str1==*str2))
	{
		if (*str1 == '\0')
		{
			return 0;
		}
		str1++;
		str2++;
	}
	return *str1 - *str2;
}
int main()
{
	char arr1[] = "adcw";
	char arr2[] = "adcwsa";
    int ret=my_strncmp(arr1, arr2, 5);
	if (ret > 0)
	{
		printf("arr1>arr2");
	}
	else if(ret==0)
	{
		printf("arr1==arr2");
	}
	else
	{
		printf("arr1<arr2");
	}
}

4.字符串查找

strstr

char * strstr ( const char *str1, const char * str2);
  • 返回指向 str2 中第一次出现的 str1 的指针,如果 str2 不是 str1 的一部分,则返回一个空指针。
  • 匹配过程不包括终止空字符,但它到此为止。
//strstr模拟实现
#include<stdio.h>
#include<string.h>
#include<assert.h>
char* my_strstr(const char* str1, const char* str2)
{
	assert(str1 && str2);
	if (*str2 == '\0')//判断特殊情况*str2是否为'\0',是则不做任何处理
	{
		return (char *)str1;//返回类型是char *,则强制类型转换为char *类型,否则编译器会出一个警告
	}
	char* s1 = NULL;//声明char *类型的指针s1,s2记录字符串和子字符串行走的位置
	char* s2 = NULL;
	char* cp = str1;//cp记录从哪个位置开始匹配
	while (*cp)
	{
		char* s1 = cp;
		s2 = str2;//第二次匹配不成功子字符串s2则回归起点,重新匹配
		while ((*s1!='\0') &&(*s2!='\0') && (*s1 == *s2))
		{
			s1++;
			s2++;
		}
		if (*s2 == '\0')
		{
			return (char*)cp;
		}
		cp++;//如果不相等,则cp目前所在的位置找不到子字符串,++往后面继续寻找,直到'\0'结束
	}
}
int main()
{
	char arr1[] = "abbcbcd";
	char arr2[] = "bcd";
	char* ret = my_strstr(arr1, arr2);
	printf("%s", ret);
}

strtok

char * strtok ( char * str, const char * sep );
  • sep参数是个字符串,定义了用作分隔符的字符集合
  • strtok函数找到str中的下一个标记,并将其用 \0 结尾,返回一个指向这个标记的指针。(注:
    strtok函数会改变被操作的字符串,所以在使用strtok函数切分的字符串一般都是临时拷贝的内容
    并且可修改。)
  • strtok函数的第一个参数不为 NULL ,函数将找到str中第一个标记,strtok函数将保存它在字符串
    中的位置。
  • strtok函数的第一个参数为 NULL ,函数将在同一个字符串中被保存的位置开始,查找下一个标
    记。
  • 如果字符串中不存在更多的标记,则返回 NULL 指针。
//函数介绍
#include<stdio.h>
#include<string.h>
#include<assert.h>
int main()
{
	char arr[] = "195.168.34.21";
	char* ret = ".";
	char arr2[20] = { 0 };
	strcpy(arr2, arr);
	char* src = strtok(arr2, ret);
	printf("%s\n", src);
	src = strtok(NULL, ret);
	printf("%s\n", src);
	src = strtok(NULL, ret);
	printf("%s\n", src);
	src = strtok(NULL, ret);
	printf("%s\n", src);
	return 0;
}

//优化代码
int main()
{
	char arr[] = "195.168.34.21";
	char* ret = ".";
	char arr2[20] = { 0 };
	strcpy(arr2, arr);
	char* src = NULL;
	for(src=strtok(arr2,ret);src!=NULL;src=strtok(NULL,ret))
	{
	   printf("%s\n",src);
	}
	return 0;
}

5.错误信息报告

strerror

char * strerror ( int errnum );
  • 返回错误码,所对应的错误信息。
  • c语言的库函数在运行的时候,如果发生一些错误,就会将错误码存在一个变量中,这个变量是:errno
  • 错误码是一些数字:1 2 3 4 5,每个数字对应着不同的错误信息
  • 我们需要将错误码编译成错误信息

在这里插入图片描述
fopen

FILE * fopen ( const char * filename, const char * mode );
#include<stdio.h>
#include<string.h>
#include<errno.h>
#include<errno.h>
//FILE *
//如果打开文件成功,就返回一个有效的指针
//如果打开文件失败,返回一个NULL指针
int main()
{
	//打开文件
	FILE* pf = fopen("test.txt", "r");//以读的方式打开
	//if (pf == NULL)
	//{
	//	printf("打开文件失败");//如果没有指定路径,文件是默认当前工程下的文件
	//}
	//打开错误信息,需要引用头文件#include
	if (pf == NULL)
	{
		printf("%s", strerror(errno));//错误码转换为错误信息
		perror("fopen");//直接打印错误信息前,会先打印自定义的信息
		return 1;//打开失败,程序提前结束
	}
	else
	{
		printf("打开文件成功");
	}
	//关闭文件
	fclose(pf);
	return 0;
}

6.字符操作

函数 如果他的参数符合下列条件就返回真

  • iscntrl 任何控制字符
  • isspace 空白字符:空格‘’,换页‘\f’,换行’\n’,回车‘\r’,制表符’\t’或者垂直制表符’\v’
  • isdigit 十进制数字 0~9
  • isxdigit 十六进制数字,包括所有十进制数字,小写字母a~f,大写字母A-F
  • islower 小写字母a~z
  • isupper 大写字母A-Z
    isalpha 字母a-z或A~Z
  • isalnum 字母或者数字,a-z,A-Z,0~9
    -ispunct 标点符号,任何不属于数字或者字母的图形字符(可打印)
  • isgraph 任何图形字符
  • isprint 任何可打印字符,包括图形字符和空白字符
//int tolower(int c);//大写字符转换为小写
//int toupper(int c);//小写字符传换为大写
/* isupper example */
#include <stdio.h>
//HELLO WORLD转换为小写
int main()
{
	printf("%c\n", toupper('a'));
	printf("%c\n", tolower('A'));
	char arr[] = "HELLO WORLD";
	int i = 0;
	while (arr[i])
	{
		if (isupper(arr[i]))//判断字符是否为大写
		{
			arr[i] = tolower(arr[i]);
		}
		printf("%c", arr[i]);
		i++;
	}
	return 0;
}

7.内存操作函数

memcpy

void * memcpy ( void * destination, const void * source, size_t num );
//参数是(void*)类型的,因为在此处不知道形参的具体类型,所以设置成(void*)
  • 函数memcpy从source的位置开始向后复制num个字节的数据到destination的内存位置。
  • 这个函数在遇到 ‘\0’ 的时候并不会停下来。
  • 如果source和destination有任何的重叠,复制的结果都是未定义的
#include<stdio.h>
int main()
{
	int arr1[] = { 1,2,3,4,5};
	int arr2[3] = { 0 };
	memcpy(arr2, arr1,12);
}

在这里插入图片描述

//模拟实现
void* my_memcpy(void* dest, const void* str, size_t num)
{
	assert(dest && str);
	void* ret = dest;
	while (num--)
	{
		*(char*)dest = *(char*)str;//由于不知道形参是什么类型,所以强制转为(char *)类型的一个字节
		/*(char*)dest++;*///err  临时的强制类型转换,类型还是(void *)
		dest = (char*)dest + 1;
		str = (char*)str + 1;
	}
	return ret;
}
#include<stdio.h>
int main()
{
	int arr1[] = { 1,2,3,4,5};
	int arr2[3] = { 0 };
	my_memcpy(arr2, arr1,12);
}

memmove

void * memmove ( void * destination, const void * source, size_t num );
  • 和memcpy的差别就是memmove函数处理的源内存块和目标内存块是可以重叠的。
  • 如果源空间和目标空间出现重叠,就得使用memmove函数处理。
#include <stdio.h>
#include <string.h>
int main ()
{
  char str[] = "memmove can be very useful......";
  memmove (str+20,str+15,11);
  puts (str);
  return 0;
}
//模拟实现
void* my_memmove(void* dest, const void* src, size_t num)
{
	assert(dest && src);
	void* ret = dest;
	if (dest < src)
	{
		//从前往后
		while (num--)
		{
			*(char*)dest = *(char*)src;
			dest = (char*)dest + 1;
			src = (char*)src + 1;
		}
	}
	else
	{
		//从后往前
		while (num--)
		{
			*((char*)dest + num) = *((char*)src + num);//起始地址的最后一个字节赋给目的地址的最后一个字节字节
		}
	}
}
int main()
{
	int arr1[] = { 1,2,3,4,5,6,7,8,9,10};
	int arr2[10] = { 0 };
	my_memmove(arr1, arr2+2,20);
	return 0;
}

memset

void * memset ( void * ptr, int value, size_t num );
  • 以字节为单位设置内存中的数据
int main()
{
	char arr[] = "hello world";
	memset(arr, 'x', 5);
	printf("%s\n", arr);
	memset(arr + 6, 'y', 5);
	printf("%s\n", arr);
}

memcmp

int memcmp ( const void * ptr1,
const void * ptr2,
size_t num );
  • 比较从ptr1和ptr2指针开始的num个字节
  • 在这里插入图片描述
int main()
{
	int arr1[] = { 1,2,3 };
	int arr2[] = { 1,2,4 };
	int ret = memcmp(arr1, arr2, 12);
	printf("%d\n", ret);
}

  • 7
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值