【C进阶】 第十章-字符串及内存函数

本节主要内容

求字符串长度

  • strlen

长度不受限制的字符串函数

  • strcpy
  • strcat
  • strcmp

长度受限制的字符串函数介绍

  • strncpy
  • strncat
  • strncmp

字符串查找

  • strstr
  • strtok

错误信息报告

  • strerror

字符操作

内存操作函数

  • memcpy
  • memmove
  • memset
  • memcmp

求字符串长度

1.1 strlen

size_t strlen ( const char * str );

size_t 为无符号数,看下面的案例

if( strlen("as")-strlen("hello") >0)
{
输出 >
}
else 
{
输出 <=
}

一眼看过去应该输出<,但是实际上为 >。

因为strlen返回的是无符号整数,无论怎么计算都是整数,要比较两字符串大小,应该写成strlen("as")>strlen("hello") 或者强转int

strlen的模拟

1.计数

2.指针-指针

3.递归

长度不受限制的字符串函数

1.2 strcpy

char* strcpy(char * destination, const char * source );

  • 源字符串必须以 '\0' 结束。
  • 会将源字符串中的 '\0' 拷贝到目标空间。
  • 目标空间必须足够大,以确保能存放源字符串。
  • 目标空间必须可变。
  • 学会模拟实现。

1.3 strcat

char* strcpy(char * destination, const char * source );

  • 源字符串必须以 '\0' 结束。

  • 目标空间必须有足够的大,能容纳下源字符串的内容。

  • 目标空间必须可修改。

  • 字符串自己给自己追加,报错

1.4 strcmp

int strcmp ( const char * str1, const char * str2 );

  • 第一个字符串大于第二个字符串,则返回大于0的数字
  • 第一个字符串等于第二个字符串,则返回0
  • 第一个字符串小于第二个字符串,则返回小于0的数字

以上函数都对字符串长度没有限制,如果源字符串大于目标字符串长度就有可能出现bug。所以引入新的一类函数。

长度受限制的字符串函数

1.5 strncpy

char * strncpy ( char * destination, const char * source, size_t num );

拷贝num个字符从源字符串到目标空间。
如果源字符串的长度小于num,则拷贝完源字符串之后,在目标的后边追加0,直到num个。

char a1[]="da"; //长2
char a2[]="dadsa";//长5
strncpy(a1,a2,2);

char a3[]="dfa";//长3
strncpy(a2,a3,2);
因为a2长5,所以会把第二个以后填0

1.6 strncat

char * strncat ( char * destination, const char * source, size_t num );

/* strncat example */
#include <stdio.h>
#include <string.h>
int main ()
{
char str1[20];
char str2[20];
strcpy (str1,"To be ");
strcpy (str2,"or not to be");
strncat (str1, str2, 6);
puts (str1);
return 0;
}

注:srcstr的长度不足num时,不会补0 


1.7 strncmp

int strncmp ( const char * str1, const char * str2, size_t num );

比较到出现另个字符不一样或者一个字符串结束或者num个字符全部比较完。

/* strncmp example */
#include <stdio.h>
#include <string.h>
int main ()
{
 char str[][5] = { "R2D2" , "C3PO" , "R2A6" };
 int n;
 puts ("Looking for R2 astromech droids...");
 for (n=0 ; n<3 ; n++)
 if (strncmp (str[n],"R2xx",2) == 0)
{
  printf ("found %s\n",str[n]);
}
 return 0;
}

代码里,strncpm的参数number为2,所以会找到前两个字符相同的字符串,再打印出来

 结果

Looking for R2 astromech droids...
found R2D2
found R2A6

1.8 strstr

char * strstr ( const char *str1, const char * str2);

           匹配字符串

模拟strstr  (BF算法)

char* my_strstr(const char* desstr,const char* srcstr) {
	assert(desstr && srcstr);
	char* s1 = desstr;
	char* s2 = srcstr;

	char* cur =desstr;
	while (*cur) {
		s1 = cur;
		s2 = srcstr;
		while (*s1 && *s2 && (*s1 == *s2)) {
			s1++;
			s2++;
		}

		if (*s2 == '\0')
			return cur;	
		cur++;
	}

	return NULL;
}

int main(){
	char a[] = "dadb";
	char b[]="ad";
	printf("%s", my_strstr(a, b));
}

输出

adb

1.9 strtok

char * strtok ( char * str, const char * sep );

  • sep参数是个字符串,定义了用作分隔符的字符集合
  • 第一个参数指定一个字符串,它包含了0个或者多个由sep字符串中一个或者多个分隔符分割的标记。
  • strtok函数找到str中的下一个标记,并将其用 \0 结尾,返回一个指向这个标记的指针。(注:strtok函数会改变被操作的字符串,所以在使用strtok函数切分的字符串一般都是临时拷贝的内容并且可修改。)
  • strtok函数的第一个参数不为 NULL ,函数将找到str中第一个标记,strtok函数将保存它在字符串中的位置。
  • strtok函数的第一个参数为 NULL ,函数将在同一个字符串中被保存的位置开始,查找下一个标记。
  • 如果字符串中不存在更多的标记,则返回 NULL 指针。

使用例

	char str[] = "game@43.56";
	const char sep[] = "@.";

	strtok(str, sep);
	strtok(NULL, sep);
	printf("%s", str);
	//操作了str ,str得到的字符串
game
	char str2[] = "game@43.56";

	printf("%s\n", strtok(str2, sep));
	//NULL返回的指针是从上次保存的位置开始,到sep的符号截至
	printf("%s\n", strtok(NULL, sep)); 
	printf("%s\n", strtok(NULL, sep));
game
43
56

 代码改进:用循环的方式获取除去分隔符的字符串

	char str[] = "ga.me@43.56@wew e.da";
	//因为strtok操作会改变原字符串,所以可以操作副本
	char buf[51] = { 0 };
	strcpy(buf, str);
	
	const char sep[] = "@. ";
	char* s = NULL;
	for (s = strtok(buf, sep); s != NULL;s=strtok(NULL,sep)) {
		printf("%s\n", s);
	}

 可以看到空格也可以作为分隔符

ga
me
43
56
wew
e
da

然鹅为什么传入NULL时每次又能从上一次的位置继续找了呢?局部变量不应该销毁了吗?猜测可能内部用了静态变量,静态变量就能保证不会马上销毁,这里就不再深入。

1.10 strerror

 char * strerror ( int errnum );

/* strerror example : error list */
#include <stdio.h>
#include <string.h>
#include <errno.h>//必须包含的头文件
int main ()
{
 FILE * pFile;
 pFile = fopen ("unexist.ent","r");
 if (pFile == NULL)
  printf ("Error opening file unexist.ent: %s\n",strerror(errno));
  //errno: Last error number
 return 0;
}

跟perror的区别:

perror只打印,而strerror能得到返回的值。

全局变量errno,保存错误类型值。

1.11 memcpy

void * memcpy ( void * destination, const void * source, size_t num );

  • 函数memcpy从source的位置开始向后复制num个字节的数据到destination的内存位置。
  • 这个函数在遇到 '\0' 的时候并不会停下来。
  • 如果source和destination有任何的重叠,复制的结果都是未定义的。(不能重叠)

1.12 memmove

void * memmove ( void * destination, const void * source, size_t num );

  • 和memcpy的差别就是memmove函数处理的源内存块和目标内存块是可以重叠的。
  • 如果源空间和目标空间出现重叠,就得使用memmove函数处理

实现里,当dest在src的左边时,从前往后拷贝;当dest在src右边且在需要拷贝的长度内时,是从后往前反向拷贝,这是为了防止覆盖源数据导致最终效果与期望不一样。(dest在右边且在长度范围外从前往后和从后往前都一样)

模拟实现

void* my_memmove(void* dest, const void* src, size_t count) {
	assert(dest && src);
	void* ret = dest;
	//右边
	if (dest > src) {
		while (count--)
			*((char*)dest + count) = *((char*)src + count);
	}
	//左边
	else 
		while (count--)
			*((char*)dest)++ = *((char*)src)++;
	return ret;
}
void t2() {
	int arr[] = { 1,2,3,4,5,6 };
	int tmp[10] = { 0 };
	my_memcpy(tmp, arr, sizeof(arr));
	my_memmove(tmp, tmp+2, 4*4);
	//目标在左,从3到6,4个元素移动到1开始的位置

	my_memmove(arr+2, arr, 4 * 4);
	//目标在右,从1到4,4个元素移动到3开始的位置
}

debug看结果

 

 

 1.13 memcmp

int memcmp ( const void * ptr1,
const void * ptr2,
size_t num );

  • 比较从ptr1和ptr2指针开始的num个字节。
  • 返回值:相等返回0;不相等,第一个不匹配的字节比较,ptr1<ptr2返回-1,ptr1>ptr2返回1。
  • 此函数是一个字节一个字节的比较

比如比较 {0,5}  {0,0x11223305}。

在小端中,的存放是 05 00 00 00 ;    0x11223305的存放是 05 33 22 11 

因此如果比较 5个字节,最后结果将返回0。只要一比较6个字节,00与33不同,将返回-1。(ptr1的此位字节<ptr2的此为字节)

1.14 memset

void *memset( void *dest, int c, size_t count );

同样一个字节一个字节的覆盖,以及c的范围是一个字节。下面把0x6611丢进去覆盖,结果每个字节只能拿到11进行覆盖。

程序1

void t3() {
	int arr[] = { 1,2,3,4,5,6 };
	memset(arr, 0x6611, 6);
}

 arr内存中存放数据

0x00BEFD38  11 11 11 11  ....
0x00BEFD3C  11 11 11 00  ....
0x00BEFD40  03 00 00 00  ....
0x00BEFD44  04 00 00 00  ....
0x00BEFD48  05 00 00 00  ....
0x00BEFD4C  06 00 00 00  ....

程序2

void t3() {
	int arr[] = { 1,2,3,4,5,6 };
	memset(arr, 5, 7);
}

 5被读为05存进去

0x010FF978  05 05 05 05  ....
0x010FF97C  05 05 05 00  ....
0x010FF980  03 00 00 00  ....
0x010FF984  04 00 00 00  ....
0x010FF988  05 00 00 00  ....
0x010FF98C  06 00 00 00  ....

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值