strlen与sizeof的区别大讲堂

1.strlen()与sizeof()各自的特点:

  • 首先得知道sizeof()并非是函数,它本质上是一个操作符;
  • 而strlen()则是一个函数, 需要的参数是一个char*类型的参数, strlen函数的功能就是在得到char*的地址后,从该地址向后数字符的个数,直到遇到 \0结束,并返回size_t无符号整型;

说起区别, 先从字符数组与字符串说起:

C语言中,字符数组与字符串完全不同; 字符串是一个特殊的字符数组,以'\0'结尾的字符数组.

char arr1[] = {'a', 'b', 'c'};
char arr2[] = "abc";

printf("%d\n", sizeof(arr1)); //arr1是字符数组,只有三个元素,占3个字节
printf("%d\n", sizeof(arr2)); //arr2是字符串,里面有'a','b','c','\0'四个元素,占 4个字节

下面以具体的情况进行区别:

第一组代码:
char arr[] = { 'a', 'b', 'c', 'd', 'e', 'f' };

printf("%d\n", sizeof(arr));		// 6 sizeof 是求内存的大小
printf("%d\n", sizeof(arr + 0));	// 4 arr + 0 => char* =>32位系统指针都是4个字节
printf("%d\n", sizeof(*arr));		// 1 *arr => char
printf("%d\n", sizeof(arr[1]));		// 1 arr[1] => char
printf("%d\n", sizeof(&arr));	        // 4 &arr => char(*)[7] 
printf("%d\n", sizeof(&arr + 1));	// 4 &arr + 1 => char(*)[7]
printf("%d\n", sizeof(&arr[0] + 1));	// 4 &arr[0] + 1 => char*

//UB 对应着错误的代码
printf("%d\n", strlen(arr));		// 未定义行为(UB)
printf("%d\n", strlen(arr + 0));	// 未定义行为(UB)
                                //*arr 得到的是 char 类型, strlen 要求的参数是 char* 类型的. 
printf("%d\n", strlen(*arr));	// 这个代码按理说, 是要编译出错的. 但是 c 是弱类型的编程语言, 把                                                                //                                 char 和char* 就给隐式转换了
printf("%d\n", strlen(arr[1]));		// 效果同上

但是如果针对一个非字符串的字符数组进行strlen()操作,这是一个很严重的未定义行为,本质上是因为数组下标访问越界!

第二组代码:
char arr[] = "abcdef";
printf("%d\n", sizeof(arr));	        // 7 sizeof 是求内存的大小, 这个大小要包含\0
printf("%d\n", sizeof(arr + 0));	// 4 arr + 0 => char*
printf("%d\n", sizeof(*arr));		// 1 *arr => char
printf("%d\n", sizeof(arr[1]));		// 1 arr[1] => char
printf("%d\n", sizeof(&arr));	        // 4 &arr => char(*)[7]
printf("%d\n", sizeof(&arr + 1));	// 4 &arr + 1 => char(*)[7]
printf("%d\n", sizeof(&arr[0] + 1));	// 4 &arr[0] + 1 => char*


printf("%d\n", strlen(arr));	// 6 此处是计算字符串长度, 不算 \0
printf("%d\n", strlen(arr + 0));// 6
printf("%d\n", strlen(*arr));	// UB *arr 得到字符, char 和 char* 类型不匹配. 按理说是要编  //                                  译失败的
printf("%d\n", strlen(arr[1]));	// 同上
printf("%d\n", strlen(&arr));	// 6 &arr char(*)[7] 类型. 和 char* 类型不匹配, 按理说是要编//                                    译失败的
			//&arr 碰巧和 arr 得到的地址值, 是相同的值. 这个结果能算对, 纯属巧合
printf("%d\n", strlen(&arr + 1)); // UB &arr + 1 跳过了整个数组, 访问数组后面的空间. 非法内存
printf("%d\n", strlen(&arr[0] + 1));  // &arr[0] => char* char* + 1 跳过一个元素, 一个char

指针:

第三组代码:
char* p = "abcdef";
printf("%d\n", sizeof(p));	    // 4 p 是 char* 
printf("%d\n", sizeof(p + 1));	    // 4 p + 1 还是 char*
printf("%d\n", sizeof(*p));	    // 1 *p char 
printf("%d\n", sizeof(p[1]));	    // 1 p[1] char
printf("%d\n", sizeof(&p));	    // 4 p char* , &p => char**
printf("%d\n", sizeof(&p + 1));	    // 同上
printf("%d\n", sizeof(&p[0] + 1));    // 4 &p[0] 是 char* 再 + 1 还是 char*

printf("%d\n", strlen(p));	// 6 p 指向的是一个字符串
printf("%d\n", strlen(p + 1));	// 5 从 p + 1 的位置往后找 5 个元素找到 \0
printf("%d\n", strlen(*p));	// UB *p => char ,strlen 要求的参数是 char* . 类型不匹配, 原则上要编译失败
printf("%d\n", strlen(p[1]));	// UB 同上
printf("%d\n", strlen(&p));	// UB &p 得到 char** 和 char* 不是相同类型. 原则上要编译失败. 此时 把 char** 强转成的 char* 并不是一个真正字符串
printf("%d\n", strlen(&p + 1));	 // UB 同上
printf("%d\n", strlen(&p[0] + 1));  // 5 &p[0] 得到的是 a 的地址. + 1 得到 b 的地址. 从 b开始往后找 5 个元素是 \0

二维数组:

//第四组
// 所谓的二维数组 本质上就是一个 一维数组. 里面的每个元素又是一个一维数组
// 长度为 3 个元素的一维数组, 里面的每个元素又是长度为 4 的一维数组
int a[3][4] = {
	{1, 2, 3, 4},
	{5, 6, 7, 8},
	{9, 10, 11, 12},
};
printf("%d\n", sizeof(a));	// 48   12 个元素, 每个元素 4 个字节
printf("%d\n", sizeof(a[0][0]));	// 4 a[0][0] => int
printf("%d\n", sizeof(a[0]));  // 16 a[0] => int[4] 类型
printf("%d\n", sizeof(a[0] + 1));	// 4 a[0] => int[4] 再 + 1 , 就隐式转成指针 int*
										//*(a[0]+1) => a[0][1] 等价 => 2
printf("%d\n", sizeof(   *  ( a[0] + 1 )  )    );	// 4 a[0] => int[4] 再 + 1 , 隐式转成 int*, 再 * 得到 int
printf("%d\n", sizeof(&a[0] + 1));		//4  a[0] => int[4]    &a[0] => int(*)[4]  再 + 1 还是数组指针  
printf("%d\n", sizeof(*(&a[0] + 1)));	// a[0] => int[4]  再&得到 int(*)[4] 再 + 1得到的还是 int(*)[4], 再解引用 int[4]
printf("%d\n", sizeof(*a)); // 16 *a => *(a + 0) => a[0] 结果 int[4]

// 16 => 3
// 未定义行为 => 4
// 这个代码并不是未定义行为
// 曾经说过的 "数组下标越界未定义行为" 前提条件是 内存访问越界. 这是程序运行时的行为
// 当下面的代码编译结束之后, 相当于变成 
// printf("%d\n", 16); 
// 这是程序运行时真正进行的逻辑
printf("%d\n", sizeof(a[3])); // 16 sizeof 是一个运算符(不是函数), 特点是, 编译期求值
printf("%d\n", a[3]);           //运行期编译的指令是: 一个取arr+3这个地址,从这个地址开始取4个字节

在此强调一下: 编译期和运行期的区别:

编译期: .c文件--->.exe 有VS编译器完成,分析代码结构,翻译为机器代码

运行期: 双击 .exe,操作系统加载可执行程序,并且执行其中的逻辑

printf("%d \'n, sizeof(arr[100]);

编译器翻译出的指令是: 打印16这样的整数.(根据arr[100]的类型int[4],算出16)

真正运行的exe中已经不存在arr[100]这样的内容.

 

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值