字符串函数与内存操作函数

字符串函数与内存操作函数

前言

C语言中对字符和字符串的处理很是频繁,但是C语言本身是没有字符串类型的,字符串通常放在常量字符串 中或者 字符数组 中。也就是我们常见的char* 与 char[ ],char*可以定义常量字符串,使其不能被修改;而 char[ ],用来定义字符数组,可以被修改。还有C语言是可以直接对内存进行操作的(比如:位运算),因此C语言中也有内存操作函数

字符串函数

strlen

  • 求字符串长度的一个库函数 - size_t strlen ( const char * str );
  • 字符串以 ‘\0’ 作为结束标志,strlen函数返回的是在字符串中 ‘\0’ 前面出现的字符个数(不包含 ‘\0’ )。 - 注意与sizeof 区分开来,sizeof算'\0'占用的空间
  • 参数指向的字符串必须要以 ‘\0’ 结束。
  • 注意函数的返回值为size_t,是无符号的( 易错 )
strlen模拟实现
1. 临时变量法
size_t my_strlen(char* s)
{
	size_t count = 0;
	while (*s != '\0')
	{
		count++;
		s++;
	}
	return count;
}
2. 递归法
size_t my_strlen(char* s)
{
	if (*s != '\0')
	{
		return 1 + my_strlen(s + 1);
	}
	return 0;
}
3. 指针 - 指针法
size_t my_strlen(char* s)
{
	char* tmp = s;
	while (*tmp != '\0')
	{
		tmp++;
	}
	return tmp - s;
}
注意:

下面的代码容易出错,因为strlen放返回值是size_t(无符号整形)类型的,在相减进行比较的时候就不可能出现 < 0的数字

#include <stdio.h>
int main()
{
	 const char*str1 = "abcdef";
	 const char*str2 = "bbb";
	 if(strlen(str2)-strlen(str1)>0)
	 {
	 	printf("str2>str1\n");  // 打印str2>str1
	 } 
	 else
	 {
	 	printf("srt1>str2\n");
	 }
	 return 0; 
 }

strcpy

  • 将源头的字符串拷贝到目标字符串中。 - char* strcpy(char* destination, const char* source );
  • 源字符串必须以 ‘\0’ 结束。
  • 拷贝时也会拷贝’\0’
  • 目标字符串的空间要足够大,以确保能够存放源字符串。
  • 目标字符串必须是可变的
strcpy模拟实现
#include <stdio.h>
#include <assert.h>
#include <string.h>

const char* my_strcpy(char* dest,const char* src)
{
	const char* tmp = dest;
	assert(src&& dest);  // 指针使用前进行判断是否为NULL
	while (*dest++ = *src++)  // 这样写的话,在最后一次'\0'结束循环的时候,'\0'也会被拷贝过去
	{
		;
	}
	return tmp;
}

int main()
{
	char* arr1 = "abcd";
	char arr2[20] = { 0 };

	printf("%s\n", my_strcpy(arr2, arr1));

	return 0;
}

strcat

  • 将源字符串追加到目标字符串后面 - char * strcat ( char * destination, const char * source );
  • 源字符串必须以 ‘\0’ 结束。
  • 目标空间必须有足够的大,能容纳下源字符串的内容。
  • 目标空间必须可修改。
strcat模拟实现
#include <stdio.h>
#include <assert.h>
#include <string.h>

char* my_strcat(char* dest, const char* src)
{
	char* tmp = dest;
	assert(dest && src);
	// 首先找到目标字符串的结尾标志 '\0'
	while (*dest)
	{
		dest++;
	}
	// 然后从 '\0'开始一个个字符的覆盖
	while (*dest++ = *src++)
	{
		;
	}
	return tmp;
}

int main()
{
	char arr1[30] = "I Love ";
	char* arr2 = "YOU";
	printf("%s\n", my_strcat(arr1, arr2));

	return 0;
}

strcmp

  • 字符串比较函数(字符串比较是对应位置的字符进行ASCII码比较)
  • int strcmp ( const char * str1, const char * str2 );
  • 标准规定:
    • 第一个字符串大于第二个字符串,则返回大于0的数字
    • 第一个字符串等于第二个字符串,则返回0
    • 第一个字符串小于第二个字符串,则返回小于0的数字
strcmp模拟实现
#include <stdio.h>
#include <assert.h>
#include <string.h>

int my_strcmp(const char* arr1, const char* arr2)
{
	while (*arr1 == *arr2)
	{
		// 两个字符串相等一定是两指针都到了字符串的结尾了'\0'处,所以要在循环里面判断,不然会发生非法访问内存
		if (*arr2 == '\0')
		{
			return 0;
		}
		arr1++;
		arr2++;
	}
	return *arr1 - *arr2;
}

int main()
{
	char* arr1 = "hello bit";
	char* arr2 = "hello world";

	int ret = my_strcmp(arr1, arr2);
	if (ret>0)
	{
		printf(">\n");
	}
	else if (ret<0)
	{
		printf("<\n");
	}
	else
	{
		printf("=\n");
	}

	return 0;
}

strstr

  • 判断源字符串是否是目标字符串的子串 - char * strstr ( const char *str1, const char * str2);
  • 返回值:子串在目标字符串中的起始位置
图片分析

在这里插入图片描述

strstr模拟实现
一:
#include <stdio.h>
#include <assert.h>
#include <string.h>

const char* my_strstr(const char* str, const char* substr)
{
	assert(str && substr);
	// 空串是任何字符串的子串
	if (*substr == '\0')
	{
		return str;
	}
	while (*str)
	{
		// 因为需要返回目标字符串中包含子串的起始地址,所以判断的时候需要将其赋给其他变量,来让其移动判断 
		const char* s1 = str;
		const char* s2 = substr;
		while (*s1 && *s2 &&*s1 == *s2)
		{
			*s1++;
			*s2++;
		}
		if (*s2 == '\0')
		{
			return str;
		}
		str++;
	}
	return NULL;
}

int main()
{
	char* arr1 = "ABABABC";
	char* arr2 = "ABABC";
	const char* ret = my_strstr(arr1,arr2);
	if (ret != NULL)
	{
		printf("%s\n", ret);
	}

	return 0;
}
二:
char* my_strstr(char* str, char* substr)
{
	unsigned int i, j, ls2;  // 下面strlen库函数的返回值unsigned int
	ls2 = strlen(substr);
	for (i = 0; i <= strlen(str) - ls2; i++)
	{
		for (j = 0; j < ls2; j++)
		{
			if (str[j + i] != substr[j])
				break;
		}
		if (j == ls2)
		{
			return str + i;
		}
	}
	return NULL;
}

strtok

  • 按照给定的字符分隔符集合(sep)来分隔字符串 - char * strtok ( char * str, const char * sep );
  • 第一个参数指定一个字符串,它包含了0个或者多个由sep字符串中一个或者多个分隔符分割的标记。
  • strtok找到一个分隔符会将其置为’\0’,然后返回’\0’对应的字符串的地址。(注:strtok函数会改变被操作的字符串,所以在使用strtok函数切分的字符串一般都是临时拷贝的内容并且可修改。)
  • strtok分割完一个字符串,会记录下该分隔符后面的字符地址;第一次分割:参数:分割字符串的首元素地址分隔符字符串的首元素地址;第二次分割:参数:NULL分隔符字符串的首元素地址
  • 如果字符串中不存在标记了,则返回NULL
example
#include <stdio.h>
#include <string.h>

int main()
{
	const char* sep = "@.";
	char arr[] = "3358925609@qq.com";

	char* str = NULL;
	for (str = strtok(arr, sep); str != NULL; str = strtok(NULL, sep))
	{
		printf("%s\n", str);
	}

	return 0;
}

在这里插入图片描述

strerror

  • 返回错误码在编译器对应的错误信息 - char * strerror ( int errnum );
  • 常与错误码(errno连用) - 头文件:errno.h
example
#include <stdio.h>
#include <string.h>
#include <errno.h>//必须包含的头文件
int main ()
{
	FILE * pFile;
    pFile = fopen ("unexist.ent","r");
    if (pFile == NULL)
        printf ("Error opening file unexist.ent: %s\n",strerror(errno));
        //errno: Last error number
    return 0; 
}

在这里插入图片描述

小总结

  1. 这些函数都是只针对字符串使用的
  2. 这些字符串函数的返回值都是为了方便函数的链式访问

其他常用函数

strncpy,strncat,strncmp - 可以限制操作元素的个数
strchr - 在一个字符串中查找一个字符

字符分类函数

函数如果他的参数符合下列条件就返回真
isxdigit十六进制数字,包括所有十进制数字,小写字母a ~ f,大写字母A ~ F
isdigit十进制数字 0~9
isupper大写字母A~Z
islower小写字母a~z
isalpha字母a ~ z或A ~ Z
isalnum字母或者数字,a ~ z,A ~ Z,0 ~ 9

字符转换

tolower大写字母转小写字母
toupper小写字母转大写字母

内存操作函数

memcpy

  • void * memcpy ( void * destination, const void * source, size_t num );
  • 函数memcpy从source的位置开始向后复制num个字节的数据到destination的内存位置。
  • 注意:memcpy虽然在VS底下dest与src可以存在重叠;但是C标准中,并未规定memcpy一定具备这种功能 - 而这种功能本应由 memmove 进行的操作
memcpy模拟实现
 //返回的还是dest首地址
#include <stdio.h>
#include <assert.h>

void* my_memcpy(void* dest, const void* src, size_t num)
{
	void* ret = dest;
	assert(dest && src);
	
	// 按字节拷贝
	while (num--)
	{
		*(char*)dest = *(char*)src;
		/*dest = (char*)dest + 1;
		src = (char*)src + 1;*/
		
		// 注意:++与()强制类型转换的优先级
		++(char*)dest;
		++(char*)src;
	}
	return ret;
}

int main()
{
	int arr3[] = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 };
	int arr4[5] = { 0 };
	my_memcpy(arr4, arr3 + 5, 20);

	for (int i = 0; i < 5; i++)
	{
		printf("%d ", arr4[i]);
	}

	return 0;
}

在这里插入图片描述

memmove

  • void * memmove ( void * destination, const void * source, size_t num );
  • 和memcpy的差别就是memmove函数处理的源内存块和目标内存块是可以重叠的。
  • 如果源空间和目标空间出现重叠,就得使用memmove函数处理。
画图解释两种情况

在这里插入图片描述

memmove模拟实现
#include <stdio.h>
#include <assert.h>

void* my_memmove(void* dest, const void* src, size_t num)
{
	void* ret = dest;
	assert(dest && src);
	// 分为前->后拷贝;后->前拷贝
	if (dest < src)
	{
		// 前->后
		while (num--)
		{
			*(char*)dest = *(char*)src;
			/*dest = (char*)dest + 1;
			src = (char*)src + 1;*/
			++(char*)dest;
			++(char*)src;
		}
	}
	else
	{
		// 后->前
		while (num--)
		{
			*((char*)dest + num) = *((char*)src + num);
		}
	}

	return ret;
}

int main()
{
	int arr3[] = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 };
	my_memmove(arr3 + 2, arr3, 20);  // 将 1,2,3,4,5拷贝到3,4,5,6,7位置上
	for (int i = 0; i < 10; i++)
	{
		printf("%d ", arr3[i]);
	}

	return 0;
}

在这里插入图片描述

memset

  • 内存设置函数 - void *memset( void *dest, int c, size_t count );
  • 按count字节个数将目标字符串初始化为指定符号c
example
//缓冲区填充
int main()
{
    char arr[10] = "";
    memset(arr,'#',10);   //会在arr数组中填充10个字符#,单位字节
    
    //err
    int arr[10] = { 0 };
    memset(arr,1,10);//最后一个位置放的是填充的字节数,不是个数
}

在这里插入图片描述

总结

以上模拟实现+简单介绍的函数就是我们编程中经常使用到的函数,我们需要弄明白其作用+原理,也要能够模拟实现出来。讲解视频:字符串函数与内存操作函数视频讲解

大家后面在函数方面有什么不懂的也可以私信博客哟,我们一起进步,也可以看看博主的另一篇博文:查找函数小工具MSDN的使用

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值