【精华文】C语言结构体特殊情况分析:结构体指针 / 基本数据类型指针,指向其他结构体

9 篇文章 1 订阅
7 篇文章 0 订阅

参考链接:Structure pointer pointing to different structure instance
注:可以查看此篇的问题和唯一的回复,那是相对正确的,不要看comment,有很多错误。

我是拒绝分析这种问题的,因为似乎没有人会这么乱用,但是……在华保健老师的编译原理示例代码和Linux0.11内核中,就遇到了这么神奇的代码,那就不得不研究一下了!毕竟是大神写的代码,我不知道应该是我渣。

1 测试代码

#include <stdio.h>
#include <stdlib.h>

struct A {
	char a;
	int b;
};

struct B {
	int c;
	int d;
};

struct C {
	int e;
	char f;
};



int main() {
	struct A a = { 'a', 100 };
	struct B b = { 101, 300 };
	struct C c = { 200,'c' };

	// 根据字节对齐,都占据8字节
	printf("A: size %d  %c  %d\n", sizeof(a), a.a, a.b);
	printf("B: size %d  %d  %d\n", sizeof(b), b.c, b.d);
	printf("C: size %d  %d  %c\n", sizeof(c), c.e, c.f);


	struct A *ap = &b; // A结构体指针,指向结构体B
	printf("%d %d\n",ap->a, ap->b);
	printf("%c %d\n", ap->a, ap->b);

	char *chp = &b;
	chp[1] = 'b';  // 这块区域其实是字节对齐导致的空闲空间
	printf("%d %d\n", ap->a, ap->b);
	printf("%c %d\n", ap->a, ap->b);

	/* 如何访问这块内存,取决于ap指针,能访问多大地方,取决于内存区域本身 */
	ap->a = 'c';  // ap->a = 'c'就是相当于 char a = 'c';
	ap->a = 1000; // ap->a = 1000 就是相当于 char a = 1000; 1000过大会被截断高位
	ap->b = 3000; // ap->b <=> int b ...

	struct C *cp = &b; // C结构体指针,指向结构体B
	printf("%d %d\n", cp->e, cp->f);
	printf("%d %c\n", cp->e, cp->f);

	cp->e = 3000;
	cp->f = 'e';
	cp->f = 1000;
	

	// 整形指针指向结构体A
	int *bp = &a;
	bp[0] = 1000;
	bp[1] = 2000;
	printf("A: %c  %d\n", a.a, a.b);
	printf("A: %d  %d\n", a.a, a.b);
	bp[2] = 2000;	// 可以修改内存,但是堆栈溢出,
						// 因为该空间没有被分配(局部变量是保存在堆栈中的)

	return 0;
}

2 结构体占据空间问题 & 字节对齐

struct A {
	char a;
	int b;
};

struct B {
	int c;
	int d;
};

struct C {
	int e;
	char f;
};

...
struct A a = { 'a', 100 };
struct B b = { 101, 300 };
struct C c = { 200,'c' };

// 根据字节对齐,都占据8字节
printf("A: size %d  %c  %d\n", sizeof(a), a.a, a.b);
printf("B: size %d  %d  %d\n", sizeof(b), b.c, b.d);
printf("C: size %d  %d  %c\n", sizeof(c), c.e, c.f);
...

运行以上程序,我们可以直到,三个结构体分别创建了一个变量,并且每个结构体占据的空间大小都是8字节

在这里插入图片描述
至于为什么都是8字节,这是内存对齐问题,不展开说明了,我们看看这几个结构体被分配的空间情况吧

在这里插入图片描述

  • 每个结构体都占8字节的内存空间
  • 红色部分表示实际占用的空间
  • 蓝色部分表示空闲空间

注意:这就意味着,凡是被分配的8字节空间,是可以任意访问的,而空间外面是不允许访问的。

让结构体A的指针ap,指向结构体B的变量b

现在我们建立一个结构体A的指针,让其指向b。

struct A *ap = &b; // A结构体指针,指向结构体B
printf("%d %d\n",ap->a, ap->b);
printf("%c %d\n", ap->a, ap->b);

在这里插入图片描述
我们看看内存的情况,再分析一下打印的结果。

在这里插入图片描述

上面是内存的分布情况,现在

  • 访问ap->a打印出来的是:101e
  • 访问ap->b打印出来的是300

所以ap指针实际访问的应该是下面重点标出的部分:
在这里插入图片描述

而这部分,是不是很熟悉?
在这里插入图片描述

所以,ap指针尽管指向了结构体B,但是实际还是按照结构体A的结构访问内存

2.1 使用char指针指向结构体B

刚才我们发现,使用结构体A的指针,可以直接访问结构体B,那么,如果是基本数据类型呢?我们试一下。

char *chp = &b;
chp[1] = 'b';  // 这块区域其实是字节对齐导致的空闲空间
printf("%d %d\n", ap->a, ap->b);
printf("%c %d\n", ap->a, ap->b);

在这里插入图片描述
我们看到内存分布如上图,现在执行chp[1] = 'b'(b的ASCII码是62)

之后就变成了:

在这里插入图片描述

哦!这是令人惊讶的,char类型的指针指向了一块内存区域,然后使用下标修改了内存的值!

还记得动态数组申请吗?和内个是一样的原理!

int *a = (int *)malloc(sizeof(int) * 10);
a[0] = 1; // 使用下标访问
a[1] = 2;
...
free(a);

告诉我们两件事

  1. 指针默认指向最开始的元素,索引是0
  2. 使用下标索引可以依次访问后面的元素,每次向后移动的内存数,取决于指针的数据类型

所以上面的事情不难理解。

然后我们继续执行程序

printf("%d %d\n", ap->a, ap->b);
printf("%c %d\n", ap->a, ap->b);

在这里插入图片描述

尽管之前的空闲空间改变了,但是结果依然不变,也就是说我们之前的说法是正确的。

在这里插入图片描述

再进一步验证

/* 如何访问这块内存,取决于ap指针,能访问多大地方,取决于内存区域本身 */
ap->a = 'c';  // ap->a = 'c'就是相当于 char a = 'c';
ap->a = 1000; // ap->a = 1000 就是相当于 char a = 1000; 1000过大会被截断高位
ap->b = 3000; // ap->b <=> int b ...

结果显而易见,对于ap->a = 1000,尽管1000已经超过了1字节大小,但是最终只修改了第一个字节,这就好比char a = 1000一样,a = 0xe8

在这里插入图片描述

是的,1000 = 0x3e8,但是只有一个字节,所以最高位的3被舍弃了。

2.2 用结构体C指针cp指向结构体B

struct C *cp = &b; // C结构体指针,指向结构体B
printf("%d %d\n", cp->e, cp->f);
printf("%d %c\n", cp->e, cp->f);

cp->e = 3000;
cp->f = 'e';
cp->f = 1000;

我们再试一试!

最终结果显而易见。

在这里插入图片描述
在这里插入图片描述

2.3 用int指针指向结构体A

// 整形指针指向结构体A
int *bp = &a;
bp[0] = 1000;
bp[1] = 2000;
printf("A: %c  %d\n", a.a, a.b);
printf("A: %d  %d\n", a.a, a.b);
bp[2] = 2000;	// 可以修改内存,但是堆栈溢出,
					// 因为该空间没有被分配(局部变量是保存在堆栈中的)

其实这个事情我们之前干过了,之前用char,现在用int再干一下。

在这里插入图片描述

这个事情进一步说明了什么呢?

  1. a提供了有限的8字节内存空间
  2. bp指针能够修改哪里,取决于它指向的地址;一次修改多大空间,取决于它数据类型的大小
  3. 指针不能修改未被分配的空间,最后bp[2]访问了外界空间,因此产生了
    在这里插入图片描述

因为局部变量都是被分配在栈中的,现在这个局部变量访问越界了,产生了错误,栈被破坏

栈破坏这里情况非常复杂,先粗浅理解为,使用了未分配的空间导致了错误吧。

Linux0.11 内核中,使用上述方法,实现了GDT和IDT。

3 小结:精华在这里

分析了这么多,最终小结一下吧。

我们的眼中只有两件事

  • 已分配的内存空间
  • 某数据类型的指针

现在,我们就让指针指向内存空间的起始地址,然后就可以操作这个内存空间了。

再增加一些限制

  • 内存空间就这么大,不能访问外面
  • 指针每次访问的地址,是通过下标访问的,一次只能移动数据类型大小的整数倍

在这里插入图片描述

这个时候你眼中的C语言,分配一块内存,再创建一个指针,打遍天下无敌手!

当然了,除了特殊情况一般没人这么干,你会疯掉,看你代码的人也会疯掉!

4 补充:直接深入底层,看汇编代码

之前我们的分析是基于C语言层级的,比较抽象,实际上,编译完成之后的汇编语言,一看就明白了。
在这里插入图片描述

你可以看到ap->a直接访问的是byte,而ap->b访问的是dword,一个是字节,一个是双字,大小自然清晰。

这也是编译器的功能,把C语言提供的,方便人类使用的大量抽象,给翻译成方便机器使用的少量指令的复杂排列组合。

5 什么叫打遍天下无敌手呢?

其实就是瞎玩儿吧……但是的确可以这么干的!我们试一试。

int main() {

	char aaa[4] = { 1,2,3,4 };
	char aaa2[4] = { 1,2,3,4 };
	int *bbb = &aaa;
	printf("\n\n%x\n\n\n", bbb[0]);
	
	return 0;
}

会打印什么呢?显而易见的!内存是01 02 03 04,然后一个int *指针访问了它,打印04030201

在这里插入图片描述

我们可以使用bbb[0]或者*b都行,因为b指向起始地址。

那,能不能通过bbb[1]访问aaa2的内存呢?

不行! 因为aaa1aaa2是两个数组变量,他们在内存中的位置不是连续的,是随机的,如果你想达到内种效果,那就是前面提到的结构体了,把这两个放进一个结构体里面,就是连续分配内存了,就能使用bbb[1]了。


最后,记住只有两件事

  • 一块已分配的内存
  • 一个指针
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
C语言中的结构体是一种自定义的数据类型,可以用于存储不同类型的数据项。结构体中的数据项称为成员,可以是整型、字符型、浮点型等任意类型。我们可以通过定义结构体变量来使用结构体,并访问其成员指针则是存储内存地址的变量,可以指向任意类型的数据。通过指针,我们可以间接访问和修改存储在内存中的数据。结合结构体指针的特性,可以实现对结构体的灵活操作。 结构体指针的应用非常广泛。首先,我们可以通过指向结构体指针来传递结构体作为函数参数,从而避免在函数调用过程中复制整个结构体的开销。这样的用法在处理大型结构体或者结构体数组时尤为重要。 其次,结构体成员也可以是指针类型,这样可以实现动态内存分配和数据管理。例如,可以使用指向结构体指针来创建动态大小的结构体数组,并通过指针来访问和操作数组的元素。 此外,结构体指针也常用于实现数据结构,如链表、树等。通过指针的相互连接,可以实现复杂的数据结构,并对其进行插入、删除、遍历等操作。 总结起来,结构体指针C语言中的应用非常灵活和广泛。通过结构体指针,我们可以实现对结构体的动态分配和管理,节省内存开销。同时,结构体指针也为实现复杂的数据结构和算法提供了便利。因此,学习和掌握结构体指针的应用对于C语言的程序开发非常重要。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

XV_

感谢您的认可,我会继续努力!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值