字符串函数和内存操作函数详解

今天的不开心就到此结束吧,明天依然光芒万丈喔,宝贝~

这里是小bang子,今天我给大家讲一下字符串函数还有内存操作函数。希望大家多多支持!


目录

01前言

02求字符串长度

🔖strlen

03长度不受限制的字符串函数

🔖strcpy

🔖strcat

🔖strcmp

04长度受限制的字符串函数

🔖strncpy

🔖strncat

🔖strncmp

05字符串查找

🔖strstr

🔖strtok

06错误信息报告

🔖strerror

07字符分类函数

08内存操作函数

🔖memcpy

🔖memmove

🔖memset

🔖memcmp


01前言

C语言中对字符和字符串的处理很是频繁,但是C语言本身是没有字符串类型的,字符串通常放在
常量字符串中或者字符数组中。
字符串常量适用于那些对它不做修改的字符串函数。

02求字符串长度

  • 🔖strlen

size_t strlen ( const char * str );
  • 字符串已经 '\0' 作为结束标志,strlen函数返回的是在字符串中 '\0' 前面出现的字符个数(不包含 '\0' )。
  • 参数指向的字符串必须要以 '\0'结束。
  • 注意函数的返回值为size_t,是无符号的易错

strlen模拟:我使用的是最简单的计数器方法

size_t my_strlen(const char* str)
{
	int count = 0;
	assert(str != NULL);
	while (*str != '\0')
	{
		count++;
		str++;
	}
	return count;
}

 实现模拟还有指针-指针或者递归的方式,大家下去可以尝试尝试。

03长度不受限制的字符串函数

  • 🔖strcpy

拷贝字符串:将源字符串内容拷贝到目标字符串

char* strcpy(char * destination, const char * source ); 
  • 源字符串必须'\0' 结束。
  • 会将源字符串中的 '\0' 拷贝到目标空间。
  • 目标空间必须足够大,以确保能存放源字符串。
  • 目标空间必须可变

 

 可以看到'\0'也拷贝了过去。

若源字符串不带'\0'则会报错。 

 搜索不到'\0'无法结束,数组越界报错。

strcpy只是复制字符串,但不限制复制的数量。很容易造成缓冲溢出,也就是说,无论dest有没有足够的空间来容纳src的字符串,它都会把src指向的字符串全部复制到dest。所以我们要保障dest的空间足够大。

 模拟strcpy:

char* my_strcpy(char*dest, const char* src)
{
	assert(src && dest);
	char* ret = dest;
	while(*dest++ = *src++)
	{
		;
	}
	return ret;
}
  • 🔖strcat

追加字符串: 将源字符串内容追加到目标字符串后,从目标字符串的'\0'处追加

 char * strcat ( char * destination, const char * source );

  • 源字符串必须以 '\0' 结束
  • 目标空间必须有足够的大,能容纳下源字符串的内容。
  • 目标空间必须可修改

模拟strcat:用ret指向字符串首地址,返回。

char* my_strcat(char* dest, char* src)
{
	assert(dest && src);
	char* ret = dest;
	//找目标空间中的\0
	while (*dest)
	{
		dest++;
	}
	//拷贝
	while (*dest++ = *src++)
	{
		;
	}

	return ret;
}
  • 🔖strcmp

比较字符串:从字符串首字符开始比较,比较ASCII码值,若相同后面的字符继续比较,直到不同返回数字。

int strcmp ( const char * str1, const char * str2 );  

ValueRelationship of string1 to string2
< 0string1 less than string2
0string1 identical to string2
> 0string1 greater than string2

 模拟strcmp:

int my_strcmp(const char* s1, const char* s2)
{
	assert(s1 && s2);
	while (*s1 == *s2)
	{
		if (*s1 == '\0')
		{
			return 0;//相等
		}

		s1++;
		s2++;
	}
	//不相等
	return *s1 - *s2;
}

04长度受限制的字符串函数

  • 🔖strncpy

char * strncpy ( char * destination, const char * source, size_t num );

与strcpy区别在于,指定拷贝的长度,若源字符串不够指定长度,后续拷贝0。

  • 🔖strncat

char * strncat ( char * destination, const char * source, size_t num );

 同strcat操作,指定追加字符串的长度。

  • 🔖strncmp

int strncmp ( const char * str1, const char * str2, size_t num );

 同strcmp操作比较到出现另个字符不一样或者一个字符串结束或者num个字符全部比较完。

05字符串查找

  • 🔖strstr

查找子串:

char * strstr ( const char *str1, const char * str2);
  • 返回一个指针,指向字符串中第一次出现的子串,如果子串没有出现在字符串中,则返回NULL。

 我们来看看运行结果:

int main()
{
	char str[] = "abcdefbcdefgh";
	char str2[]="cde";
	char* ret = strstr(str, str2);
	if (ret == NULL)
	{
		printf("没找到\n");
	}
	else
		printf("%s\n", ret);
	return 0;
}

 

 究竟如何实现的查找子串的操作,我们来模拟讲解讲解:

char* my_strstr(const char* str1, const char* str2)
{
	assert(str1 && str2);

	const char* s1 = str1;
	const char* s2 = str2;

	const char* cur = str1;
	while (*cur)
	{
		s1 = cur;
		s2 = str2;

		while (*s1 && *s2 && (*s1 == *s2))
		{
			s1++;
			s2++;
		}
		if (*s2 == '\0')
		{
			return (char*)cur;
		}
		cur++;
	}

	return NULL;//找不到
}

 

首先需要s1,s2指针来进行串内查找,cur指针标记主串当前查找位置。

 查找成功:

 

向后进行查找,如果查找到s2的第一个字符则s1,s2继续向后比对,如果s2指向'\0'代表查找成功,主串中有子串,若比对过程中s1与s2不相当,则退出比对,cur++,从主串下一个字符开始查找,s1指向当前查找位置,s2移回子串首字符。

查找失败: 

 

 

 

 cur指向主串结束符,退出循环返回NULL。

  • 🔖strtok

分割字符串

char * strtok ( char * str, const char * sep );
  • sep参数是个字符串,定义了用作分隔符的字符集合
  • 第一个参数指定一个字符串,它包含了0个或者多个由sep字符串中一个或者多个分隔符分割的标记。
  • strtok 函数找到 str 中的下一个标记,并将其 用\0 结尾 ,返回一个指向这个标记的指针。(注: strtok函数会改变被操作的字符串 ,所以在使用 strtok 函数切分的字符串一般都是临时拷贝的内容并且可修改。)
  • strtok函数的第一个参数不为 NULL ,函数将找到str中第一个标记,strtok函数将保存它在字符串中的位置
  • strtok函数的第一个参数为 NULL ,函数将在同一个字符串中被保存的位置开始,查找下一个标记。
  • 如果字符串中不存在更多的标记,则返回 NULL 指针。
#include <stdio.h>
int main()
{
     char *p = "zhangpengwei@bitedu.tech";
     const char* sep = ".@";
     char arr[30];
     char *str = NULL;
     strcpy(arr, p);//将数据拷贝一份,处理arr数组的内容
     for(str=strtok(arr, sep); str != NULL; str=strtok(NULL, sep))
     {
     printf("%s\n", str);
     }
}

看看调试过程,将标记替换成\0,再从保存位置处继续查找标记。 

 

 

 

 

 

 很巧妙使用for循环实现自动分割次数的操作。

06错误信息报告

  • 🔖strerror

char * strerror ( int errnum );

返回错误码,所对应的错误信息。  

 如果程序有错误码,则通过

printf("%s\n,strerror(错误码))

打印出错误信息。

07字符分类函数

函数
如果他的参数符合下列条件就返回真
iscntrl
任何控制字符
isspace
空白字符:空格 ‘ ’ ,换页 ‘\f’ ,换行 '\n' ,回车 ‘\r’ ,制表符 '\t' 或者垂直制表符 '\v'
isdigit
十进制数字 0~9
isxdigit
十六进制数字,包括所有十进制数字,小写字母 a~f ,大写字母 A~F
islower
小写字母 a~z
isupper
大写字母 A~Z
isalpha
字母 a~z A~Z
isalnum
字母或者数字, a~z,A~Z,0~9
ispunct
标点符号,任何不属于数字或者字母的图形字符(可打印)
isgraph
任何图形字符
isprint
任何可打印字符,包括图形字符和空白字符

08内存操作函数

  • 🔖memcpy

void * memcpy ( void * destination, const void * source, size_t num );
  • 函数memcpysource的位置开始向后复制num个字节的数据到destination的内存位置。
  • 这个函数在遇到 '\0' 的时候并不会停下来
  • 如果sourcedestination有任何的重叠,复制的结果都是未定义的

 假设数组数据是1,2,3,4,5,6,7,8,9;先在将1234拷贝到5678。我们画图讲解:

 在内存中是小端字节序存储,我们展开来看:

 与qsort一样,都是通过一个一个字节来实现数据的变换。

值得注意的是:memcpy本来是不具备拷贝重叠空间的情况,所以我在模拟的时候并没有考虑占据重叠空间,但在后续的函数改进中,memcpy现在具备了处理占据重叠空间的能力。

模拟memcpy 

void* my_memcpy(void* dest, void* scr, size_t count)
{
	assert(dest && scr);
	void* res = dest;
	while (count--)
	{
		*(char*)dest = *(char*)scr;
		dest = (char*)dest + 1;
		scr = (char*)scr + 1;
	}
	return res;
}

强制转换成 char * 类型访问1个字节,以字节进行复制,再用1个指针返回目的地的起始地址。

  • 🔖memmove

void * memmove ( void * destination, const void * source, size_t num );
  • memcpy的差别就是memmove函数处理的源内存块和目标内存块是可以重叠的。
  • 如果源空间和目标空间出现重叠,就得使用memmove函数处理。

 memmove因为要处理重叠内存块所以,要分情况讨论拷贝方式:

 

重叠情况如果不用从后往前,而用从前往后则会出现错误:如下图

  

 模拟memmove

void* my_memmove(void* dest, void* scr, size_t count)
{
	assert(dest && scr);
	void* res = dest;
	if (dest < scr)
	{	//前->后
		while (count--)
		{
			*(char*)dest = *(char*)scr;
			(char*)dest+=1;
			(char*)scr+=1;
		}
	}
	else
	{
		//后->前
		while (count--)
		{
			*((char*)dest+count) = *((char*)scr+count);
		}
	}
	return res;
}
  • 🔖memset

内存设置——memset

void * memset( void * destination, int  c, size_t num);

 从目标地址开始操作num个字节,设置成c

 我们查看内存看看是否是这样设置字节:

  • 🔖memcmp

int memcmp ( const void * ptr1, const void * ptr2, size_t num );

比较从ptr1ptr2指针开始的num个字节 。

Return ValueRelationship of First count Bytes of buf1 and buf2
< 0buf1 less than buf2
0buf1 identical to buf2
> 0buf1 greater than buf2

 我们写段程序验证下:

int main()
{
	char buffer1[] = "DWgaOtP12df0";
	char buffer2[] = "DWGAOTP12DF0";
	int n;
	n = memcmp(buffer1, buffer2, sizeof(buffer1));
	if (n > 0) printf("'%s' is greater than '%s'.\n", buffer1, buffer2);
	else if (n < 0) printf("'%s' is less than '%s'.\n", buffer1, buffer2);
	else printf("'%s' is the same as '%s'.\n", buffer1, buffer2);
	return 0;
}

比较到第三个字符时,'g'的ASCII码比'G'的大返回>0。


 以上就是本次字符串函数和内存函数的讲解,希望对大家有所帮助,谢谢!

 

 

评论 23
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值