数组和指针

指针和数组

指针

变量:

定义一个变量,本质就是在内存中根据类型开辟空间.有了空间就必须具有地址来标识空间,方便CPU进行寻址,有了空间就可以把数据保存起来.

  • 指针就是地址,地址本质就是数据,数据可以被保存在变量空间里面.
  • 指针变量:是存放指针数据的,空间是左值,内容是右值.

所以,当指针变量取右值的时候是等价于指针的.

指针变量是操作指针(地址)的抓手,更加的方便相比于直接使用指针字面值进行操作.

#include<stdio.h>
int main()
{
    //定义整形变量
	int a = 10;	//使用的是a的空间;左值
	int b = a;  //使用的是a的内容:右值,a==10

	int* p = &a;	//指针变量本质是变量,然后里面保存的是地址(指针)值
	p = (int*)0x1234;//p变量的空间:左值
	int* q = p;		 //p变量的内容:右值->0x1234

	(int*)0x123456;//指针<->地址
	*((int*)0x123456) = 10;//通过指针是可以直接访问的

	return 0;
}

对指针解引用,得到的是指针所指向的目标.

指针变量也是变量,他也有地址,也可以用变量存储起来,就是二级指针变量.

为什么要有指针

如果没有定位的能力,只能通过遍历的方式寻找目标内容,提高查找效率.

32位机器下能够识别多大的物理内存.

image-20230508122909905

既然CPU寻址按照字节寻址,但是内存又很大,所以,内存可以看做众多字节的集合.

image-20230508123306126

其中,每个内存字节空间,相当于一个学生宿舍,字节空间里面能放8个比特位,就好比同学们住的八人间,每个人是一个比特位。

每间宿舍都有门牌号就等价于每个字节空间对应的地址,即该空间对应的指针。

那么,为何要存在指针呢?为了CPU寻址的效率。

如何理解编址

首先,必须理解,计算机内是有很多的硬件单元,而硬件单元是要互相协同工作的。所谓的协同,至少相互之间要能够进行数据传递。

但是硬件与硬件之间是互相独立的,那么如何通信呢?答案很简单,用"线"连起来。

而CPU和内存之间也是有大量的数据交互的,所以,两者必须也用线连起来。

不过,我们今天关心一组线,叫做地址总线。
CPU访问内存中的某个字节空间,必须知道这个字节空间在内存的什么位置,而因为内存中字节很多,所以需要给内存进行编址(就如同宿舍很多,需要给宿舍编号一样)

计算机中的编址,并不是把每个字节的地址记录下来,而是通过硬件设计完成的。

钢琴 吉他 上面没有写上“都瑞咪发嗦啦”这样的信息,但演奏者照样能够准确找到每一个琴弦的每一个位置,这是为何?因为制造商已经在乐器硬件层面上设计好了,并且所有的演奏者都知道。本质是一种约定出来的共识!

硬件编址也是如此,我们可以简单理解,32位机器有32根地址总线,每根线只有两态,表示0,1【电脉冲有无】,那么一根线,就能表示2中含义,2根线就能表示4中含义,依次类推。32根地址线,就能表示2^32中含义,每一种含义都代表一个地址。

地址信息被下达给内存,在内存内部,就可以找到改地址对应的数据,将数据在通过数据总线传入CPU内寄存器.

指针的内存布局

一个整形,有4个字节,那么应该有4个地址!

  • 那么&a取了哪一个地址?首地址
  • 那么如何全部访问这4个字节呢?通过首地址,根据类型向后访问4字节的空间

所谓的强制类型转化,就是起始地址不变,改变的是向后访问字节的个数.

指针解引用

对指针解引用,就是指针指向的目标。所以*p,就是a .至于是空间还是内容要根据左值还是右值来区分.

int main()
{
    int a=0;
    int * p=&a;
    *p=10;
}

*p使用的是左值还是右值?是右值,直接访问指针变量里面的右值.

image-20230508125000022

如何将数值存储到指定的内存地址
知道了指针的本质就是地址,地址就是数据,那么我们可以直接通过地址数据对变量进行访问吗?
题外话:大部分技术书,一定是落后于行业的。这本书也是,目前主流的编译器和操作系统,为了安全,已经有了很多内存
保护的机制。我们目前的win和Linux都有栈随机化这样的机制来方式黑客对用户数据地址进行预测。当然,还有其他的栈保护机制,比如“金丝雀”技术之类的。
经过试验,目前vs2013和Centos7上,使用C语言定义的局部变量,在每次运行的时候,地址都是不同的。经过试验发现,定义全局变量,每次更改代码,地址也会发生变化。所以这个实验没法正确做出来,但是程序崩溃,也能说明问题。
题外话:个人认为,书中这部分内容,是非常好的理解案例.
栈随机化

栈开辟空间是变化的,函数栈中的变量的地址也是会发生变化的.全局变量不会轻易发生变换,但是当前后顺序或者新增减少变量时,地址也是会变化的.

image-20230508144117374

数组

数组的内存布局

image-20230508151434274

在main函数中定义变量,在栈空间开辟空间,地址是从高地址向低地址方向开辟的.独立的变量地址是递减的.

image-20230508151228674

在开辟空间的时候,不应该被认为是一个个独立的元素,应该是整体开辟空间,整体释放.

所以数组中的元素地址依次是向着增大的方向分布的.所以访问时永远是i++的.

image-20230508151121423

&a[0] VS &a
步长问题

对指针+1其实是+上其指针所指向类型的大小.

int main()
{
	char* c = NULL;
	short* s = NULL;
	int* i = NULL;
	double* d = NULL;

	int a = 10;
	double* b = (double*)&a;

    //二级及往上都是4字节
	double** pb = NULL;
	double*********** pb1 = NULL;

	printf("%d\n", c);
	printf("%d\n\n", c + 1);

	printf("%d\n", s);
	printf("%d\n\n", s + 1);

	printf("%d\n", i);
	printf("%d\n\n", i + 1);

	printf("%d\n", d);
	printf("%d\n\n", d + 1);

	printf("%d\n", b);
	printf("%d\n\n", b + 1);

	printf("%d\n", pb);
	printf("%d\n\n", pb + 1);

	printf("%d\n", pb1);
	printf("%d\n\n", pb1 + 1);
	system("pause");
	return 0;
}

image-20230508152534192

数组名使用时代表整个数组:

  1. &arr:数组的地址
  2. sizeof(arr):整个数组

[]优先级>&

image-20230508152711458

&arr[0] 和 &arr虽然地址数字一样大,但是类型意义完全不同 .因为首元素的地址和数组整体开辟的获取到的最小的地址是重叠的.

  • 数组名做右值的时候代表的是数组收元素的地址.

image-20230508155743042

  • 数组是不支持整体赋值的,支持整体初始化,不能作为左值来使用.只能使用[]指定位置赋值.
指针和数组无关

访问元素上方式相似.

int main()
{
	char* str1 = "hello yuanwei";
	const char* str2 = "hello yuanwei";
	//存放于字符常量区,不可被修改,属于系统层面的保护
	//const属于编译器提醒保护
	//str1[1] = 'H';//fatal 系统级别保护

	char buffer[] = "hello world";
	//存放于栈区,用户有权进行修改内容

	int len = strlen(str1);
	for (int i = 0; i < len; i++)
	{
		printf("%c ",*(str1+i));//指针方式打印
		printf("%c ",str1[i]);//数组方式打印
	}
	int len2 = strlen(buffer);
	for (int i = 0; i < len2; i++)
	{
		printf("%c ", *(buffer + i));//指针方式打印
		printf("%c ", buffer[i]);//数组方式打印
	}
	return 0;
}
C为何要这样设计
  1. 数组传参,降维成指针.

image-20230509134104699

  1. 为什么要降维?

如果不降维,就会发生全拷贝,函数调用效率降低.所以会降维,但是:

  • 传参时是否生成临时拷贝?指针变量还是变量,仍然是拷贝4字节的指针.

image-20230509134616416

arr是代表数组首元素,传参时发生降维为指针类型(首元素地址值),形参根据类型开辟空间大小,空间初始化(实例化)时将传来的指针数据填充进形参的空间.这个形参就是临时变量,是那个一份拷贝.

  1. 降维成啥?

所有的数组传参,都会降维成指针,降维为指向其内部元素类型的指针.

  1. 在C语言中,任何函数调用只要有形参实例化,必定形成临时拷贝.

  2. 形参中的一维数组[]中的数字可以忽略.

  3. C面向过程语言,遇到啥解决啥,函数是核心,定义和调用函数传参,数组,数组传参,为了效率降维.

  4. 假设指针和数组访问元素方式不通用,在函数中由于降维是指针,只能用指针的方式访问,在主函数中只能用数组的方式访问,程序员需要不断地在不同的代码片段处进行习惯的切换,增加错误的概率.

  5. 为了让减少出错的概率,所以指针和数组访问元素的方式设置为通用.

指针数组和数组指针

typedef int* p1_t[5];
typedef int(* p2_t)[5];

int main()
{
	int* p1[5];//指针数组,数组内部可以放任何类型(内置类型+自定义类型)
	int(*p2)[5];//数组指针,指针可以指向任何合法的类型变量

	p1_t p1_[5];
	p2_t p2_[5];
	system("pause");
	return 0;
}
数组元素个数是否是数组类型的一部分?是
int main()
{
	int arr[10];
	//arr是int* 类型代表的是首元素地址
	//int(*p)[10]=arr;//warning C4047: “初始化”:“int (*)[10]”与“int *”的间接级别不同
	int(*p)[10] = &arr;//&arr代表的是数组地址

	int(*p1)[11] = &arr;//warning C4048: “int (*)[11]”和“int (*)[10]”数组的下标不同
	//所以数组元素个数也是作为数组的一部分,一旦两个数组的元素个数不同,也不认为两个数组是相同的.
	printf("%d",sizeof(p));//4
	system("pause");
	return 0;
}
地址的强制转化

所谓的强制类型转化,本质是改变看待数据的方式,数据本身不会发生任何变化.

image-20230510093415956

根据目标类型改变看待数据的方式.

image-20230510094122467

image-20230510100038219

  • 例一
struct Test
{
	int Num;
	char* pcName;
	short sDate;
	char cha[2];
	short sBa[4];
}*p = (struct Test*)0x100000;

//假设p 的值为0x100000。 如下表表达式的值分别为多少?
int main()
{
	printf("%d\n",sizeof(struct Test));//20->0x14

	printf("%p\n", p + 0x1);			//0x100014
	printf("%p\n", (unsigned long)p + 0x1);//0x100001 以unsigned long类型看待这个数据,就是数字相加
	printf("%p\n", (unsigned int*)p + 0x1);//0x100004

	printf("%d\n",sizeof(unsigned long));//4
	system("pause");
	return 0;
}
  • 例二

image-20230510101807748

int main()
{
	int a[4] = { 1, 2, 3, 4 };
	int* ptr1 = (int*)(&a + 1);
	int* ptr2 = (int*)((int)a + 1);
	printf("%x,%x\n", ptr1[-1], *ptr2);
	system("pause");
	return 0;
}

多维数组和多级指针

理解链:
数组的定义是:具有相同数据元素类型的集合,特征是,数组中可以保存任意类型。
那么数组中可以保存数组吗?答案是可以!
在理解上,我们甚至可以理解所有的数组都可以当成"一维数组"!(这样理解的好处,我们后面就说)
就二维数组来说,我们认为二维数组,可以被看做“一维数组”,只不过内部“元素”也是一维数组
那么内部一维数组是在内存中布局是“线性连续且递增”的,多个该一维数组构成另一个“一维数组”,那么整体便也是线性连续且递增的,这也就解释了,上述地址为何是连续的。
在强调一遍,我们认为:二维数组可以被看做内部元素是一维数组的一维数组.

image-20230510111310769

证明数组线性的概念:二维数组的遍历.

int main()
{
	char c[4][3] = {
		{1,2,3},
		{4,5,6},
		{7,8,9},
		{-1,-2,-3}
	};
	char* p = (char*)c;
	for (int i = 0; i < 4 * 3; i++)
	{
		printf("%d\n", *(p + i));
	}
}

二维数组

int main()
{
	int a[3][4] = { 0 };
	printf("%d\n", sizeof(a)); //48
	printf("%d\n", sizeof(a[0][0])); //4
	printf("%d\n", sizeof(a[0])); //16
	printf("%d\n", sizeof(a[0] + 1)); //第一个元素,数组中的第二个int的地址,4
	printf("%d\n", sizeof(*(a[0] + 1))); //a[0][1],4
	printf("%d\n", sizeof(a + 1)); //a代表首元素地址(指针),+1 代表第二个元素的地址(指针),4
	printf("%d\n", sizeof(*(a + 1))); //第二个元素,4*4=16
	printf("%d\n", sizeof(&a[0] + 1)); //第二个元素的地址(指针),4
	printf("%d\n", sizeof(*(&a[0] + 1))); //第二个元素,4*4=16
	printf("%d\n", sizeof(*a)); //数组第一个元素,4*4=16
	printf("%d\n", sizeof(a[3])); //16
	return 0;
}
int main()
{
	int a[5][5];
	int(*p)[4];
	p = a;
	printf("a_ptr=%p,p_ptr=%p\n", &a[4][2], &p[4][2]);
	printf("%p,%d\n", &p[4][2] - &a[4][2], &p[4][2] - &a[4][2]);

	//指针相减,代表指针之间所经历的元素的个数
}

image-20230511174859863

二级指针

  • 指针变量也是变量,变量就有地址,地址就可以放在另一个变量中存储.
  • 指针解引用得到的就是指针所指向的目标.

image-20230511175347748

数组传参和指针参数

  • 数组传参时一定要穿数组名,就是首元素的地址.(降维原因)
  • 形参实例化时发生一次临时拷贝,C语言中只要传参就会生成临时拷贝.
  • 一维数组传参时,元素个数是被忽略的.

一级指针传参也要发生值拷贝,要对指针传参指向一块空间,需要传址传参

void GetStr(char** pp)//二级指针接收
//void GetStr(char* pp)//pp是这个函数栈帧的临时变量,出作用域会被销毁
{
	*pp = malloc(sizeof(char) * NUM);
	if (NULL != *pp) {
		strcpy(*pp, "hello");
	}
	else {
		//do nothing!
	}
}
int main()
{
	char* p = NULL;
	GetStr(&p);//传址传参
    //GetStr(p);//传值传参
	printf("%s\n", p);//hello
    //printf("%s\n", p);//null,函数中的修改是在pp新空间进行的,pp被销毁了还,p空间没有任何变化
	system("pause");
	return 0;
}
二维数组传参
  • 所有数组都可以被看为一维数组.
  • 所有数组传参都要降维,降维成为指针.指向其内部元素类型的指针.
//void print1(int (*a)[6])		//1
//void print(int a[5][6])
//void print(int a[][6])//一维数组的维度大小是可以被省略的,二维数组第一个维度也可以被省略
void print(int a[][6],int num)//标准写法
{

}

//void print2(int(*a)[6][7][8][9])
void print2(int(*a)[][7][8][9])
//void print2(int(*a)[][][8][9])//error
{

}
int main()
{
	int a[5][6] = {0};
	int b[5][6][7][8][9] = {0};
	print(a,5);
	print1(a);//a是首元素地址,就是一个数组的地址,所以接收为1
	print2(b);
	return 0;
}
为什么第二个维度之后不能省略大小呢?

之前我们证明过数组大小也是数组类型的一部分,

如果我们省略了第二个之后的下标,指针类型不明确.

//void print(int(*p)[],int num)//warning C4048: “int (*)[0]”和“int [5][6]”数组的下标不同
void print(int(*p)[6],int num)
{
}
int main()
{
	int a[5][6] = {0};
	print(a,5);
	return 0;
}

函数指针

为什么函数也有地址?

函数是代码的一部分,程序运行的时候也要加载进内存,以供CPU后续寻址访问代码也有地址.

image-20230512094523667

函数地址

众多编译器中,函数地址就是他代码块的起始地址.但是在vs中经历了一次jmp跳转.也就是说&fun得到的是jmp的地址,jmp再跳转到函数起始地址.

image-20230512100055442

函数有地址,是数据就可以被变量保存=>函数指针类型

void fun()
{
	printf("hello yuanwei \n");
}
int main()
{
	void (*p)() = fun;
	(*p)();//p是左值,解引用得到地址值
	p();//p直接取右值地址直接调用
}
(*(void (*)())0)()

image-20230512102742960

int main()
{
	void(*p)();//函数指针
	void(*p[10])();//函数指针 数组
	void(*(*p)[10])();//函数指针 数组 指针
	void(*(*p[5])[10])();//函数指针 数组 指针 数组
	return 0;
}
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值