C语言.指针的基本语法（1）

最新推荐文章于 2024-07-25 17:33:54 发布

Joseit

最新推荐文章于 2024-07-25 17:33:54 发布

阅读量693

点赞数 23

分类专栏： C语言基本语法文章标签： c语言 microsoft 开发语言

本文链接：https://blog.csdn.net/Joseit/article/details/136979770

版权

C语言基本语法专栏收录该内容

20 篇文章 0 订阅

订阅专栏

1.内存和地址

1.1内存

我们知道计算机上CPU（中央处理器）在处理数据的时候，需要的数据是在内存中读取的。处理后的数据也会放回内存中。

那我们买电脑的时候，电脑上内存是8G/16G/32G等，那这些内存空间如何高效的管理？

其实也是把内存划分为一个个的内存单元，每个内存单元的大小取1个字节。

计算机中常见的单位：
一个比特位可以存储一个2进制的位1或者0

bit - 比特位   1byte = 8bit
byte - 字节    1KB = 1024byte
KB            1MB = 1024KB
MB            1GB = 1024MB
GB            1TB = 1024GB
TB            1PB = 1024TB
PB

其实，每一个内存单元，一个字节空间里面能放8个比特位，而每个内存单元也都是有一个编号，有了这个内存单元的编号，CPU就可以快速找到一个内存单元。

在计算机中我们把内存单元的编号称为地址。C语言中给地址起了新的名字叫：指针

所以我们可以这样理解：

内存单元的编号 == 地址 == 指针

1.2怎样理解编址

CPU访问内存中的某个字节空间在内存的什么位置，而因为内存中字节很多，所以需要给内存进行编址。

计算机中的编址，并不是把每个字节的地址记录下来，而是通过硬件设置完成的。
在这里插入图片描述

首先，必须理解，计算机内是有很多硬件单元，而硬件单元是要互相协同工作的。所谓的协同，至少相互之间要能够进行数据传递。
但是硬件与硬件之间是相互独立的，那么如何通信呢？答案很简单，用“线”连起来。

而CPU和内存之间也是有大量的数据交互的，所以两者必须也用线连起来。不过，我们今天关注的是一组线，叫地址总线。

3 . 硬件编址也是如此

我们可以简单理解，32位机器有32根地址总线，每根线只有两个状态，表示0，1【电脉冲有无】，那么一条线，就能表示2种含义，2根线就能表示4种含义，依此类推。 32根地址线，就能代表 2^32种含义，每一种含义都代表一个地址。

4.地址信息被下达给内存后，在内存上，都可以找到该地址对应的数据，将数据再通过数据总线传入CPU内寄存器。

2.指针变量与地址

2.1取地址操作符（&）

理解了内存和地址的关系，回到C语言中，在C语言中创建变量其实就是像内存申请空间，比如：

#include<stdio.h>

int main()
{
    int a = 0;//0x95CF150C

    return 0;
}

在这里插入图片描述
比如，上述的代码就创建了整型变量a，内存中申请4个字节，用于存放整数0，其中每个字节都有地址，上图4个字节的地址分别是：

0x95CF150C
0x95CF150D
0x95CF150E
0x95CF150F

那我们如何得到a的地址呢？
学习一个操作符（&）-- 取地址操作符

#include<stdio.h>

int main()
{
    int a = 10;
    &a;//取出a的地址
    printf("%p\n", &a);//%p 是用来打印地址的
    return 0;
}

在这里插入图片描述

按照我画图的例子，会打印处理：0x95CF150C

&a取出的a所占4个字节中地址较小的字节地址。
虽然整型变量占用4个字节，我们只要知道了第一个字节地址，顺藤摸瓜访问到4个字节的数据也是可行的。

2.2指针变量和解引用操作符（*）

2.2.1指针变量

那我们通过取地址操作符(&)拿到的地址是一个数值，比如：0x95CF150C，这个数值有时候也是需要存储起来，方便后期再使用的，那我们把这样的地址值存放在哪里呢？答案是：指针变量中。

比如：

#include<stdio.h>

int main()
{
	int a = 10;
	int* pa = &a;
	//
	printf("*pa = %d\n", *pa);//10

	return 0;
}

指针变量也是一种变量，这种变量就是用来存放地址的，存放指针变量的值都会理解为地址。

2.2.2如何拆解指针变量

我们看到pa的类型是 int* ,我们该如何理解指针的类型呢？

int a = 10;
int* pa = &a;

这里pa左边写的是 int* ， * 是在说明pa是指针变量，而前面的 int 是在说明pa指向的是整型 (int) 类型的对象。

在这里插入图片描述
那如果有一个char类型的变量，ch的地址，要放在什么类型的指针变量中呢？

char ch = 'q';
pc = &ch;//pc的类型怎么写？

2.2.3解引用操作符

我们将地址保存起来，未来是要使用的，那怎么使用呢？

在C语言中，我们只要拿到了地址（指针），就可以通过地址（指针）找到地址（指针）指向的对象，这里学习一个操作符叫解引用操作符（*）

#include<stdio.h>

int main()
{
	int a = 10;
	int* pa = &a;
	//改变a的值
	*pa = 20;
	//打印
	printf("a = %d\n", a);//20

	return 0;
}

上面代码中第8行就使用了解引用操作符， *pa 的意思就是通过pa中存放的地址，找到指向的空间，*pa 其实就是a变量了；所以 *pa = 0，这个操作符是把a改成了0.
有同学肯定在想，这里如果目的就是把a改成0的话，写成 a = 0; 不就完了，为啥非要使用指针呢？

其实这里是把a的修改交给了pa来操作，这样对a的修改，就多了一种的途径，写代码就会更加灵活，后期慢慢就能理解了。

2.3指针变量的大小

前面的内容我们了解到，32位机器假设有32根地址总线，每根地址线出来的电信号转换为数字信号后是0或1，那我们把32根地址线产生的2进制序列当成一个地址，那么一个地址就是32个bit位，需要4个字节才能存储。
如果指针变量是用来过来存放地址的，那么指针变量的大小就得是4个字节才行。换句话说，地址有多大，指针变量有多大。
同理64位机器，假设有64根地址线，一个地址就是64个二进制组成的二进制序列，存储起来就需要8个字节（64bit位）的空间，指针变量的大小就是8个字节。

#include<stdio.h>
//指针变量的大小取决于地址的大小
//32位的机器的地址是32位bit位(即4个字节)
//64位的机器的地址是64位bit位(即8个字节)
int main()
{
	printf("%zd\n", sizeof(char*));
	printf("%zd\n", sizeof(short*));
	printf("%zd\n", sizeof(int*));
	printf("%zd\n", sizeof(double*));

	return 0;
}

在这里插入图片描述
结论：

32位平台下地址是32个bit位，指针变量大小是4个字节。
64位平台下地址是64个bit位，指针变量大小是8个字节。
注意指针变量的大小和类型是无关的，只要指针类型的变量，在相同的平台下，大小都是相同的。

3.指针变量类型的意义

指针变量的大小和类型无关，只要是指针变量，在同一个平台下，大小都是一样的，为什么还要有各种各样的指针类型呢？

其实指针类型是有特殊意义的，接着继续学习。

3.1指针的解引用

对比一下两段代码，主要是调试时观察内存的变化。

//代码1
#include<stdio.h>

int main()
{
	int n = 0x11223344;
	int* pn = &n;
 
  *pn = 0;
 
	return 0;
}

//代码2
#include<stdio.h>

int main()
{
	int n = 0x11223344;
	char* pc = (char*)&n;

	*pc = 0;

	return 0;
}

调试我们可以看到，代码1会将n的4个字节全部变成0，而代码2只是将n的第1个字节改为0

结论：指针的类型决定了，对指针解引用的时候有多大的权限（⼀次能操作几个字节）。
比如： char* 的指针解引用就只能访问一个字节，而 int* 的指针的解引用就能访问四个字节。

3.2指针±整数

看一段代码，调试观察地址的变化：

#include<stdio.h>

int main()
{
	int n = 0;
	char* pc = (char*)&n;
	int* pi = &n;
	//打印
	printf("&n = %p\n",         &n);//000000DD2D1BF644
	printf("pc = %p\n",         pc);//000000DD2D1BF644
	printf("pc + 1 = %p\n", pc + 1);//000000DD2D1BF645
	printf("pi = %p\n",         pi);//000000DD2D1BF644
	printf("pi = %p\n",     pi + 1);//000000DD2D1BF648

	return 0;
}

代码运行如下：
在这里插入图片描述
我们可以看出：

char* 类型的指针变量+1跳过1个字节， int* 类型的指针变量+1跳过了4个字节。这就是指针变量的类型差异带来的变化。指针+1，其实跳过1个指针指向的元素。指针可以+1，那也可以-1。

结论：
指针的类型决定了指针向前或者向后走一步有多大（距离）。

3.3void* 指针

在指针类型中有一种特殊的类型是void* 类型的，可以理解为无具体类型的指针（或者叫泛型指针），这种类型可以用来接受任何类型的指针。但是也有局限性， void*类型的指针不能直接进入指针 ± 整数和解引用的运算。

举例：

#include<stdio.h>

int main()
{
	int a = 10;

	int* pa = &a;
	char* pc = &a;

	return 0;
}

在上面的代码中，将一个int类型的变量赋值给一个char* 类型的指针变量。编译器给出了一个警告（如下图），因为类型不兼容，而使用void*类型就不会有这样的问题。

在这里插入图片描述
使用 void* 类型的指针接收地址：

#include<stdio.h>

int main()
{
	int a = 10;

	void* pa = &a;
	void* pc = &a;

	*pa = 10;//error
	*pc = 0;//error

	return 0;
}

VS2022编译代码的结果：

在这里插入图片描述
这里我们可以看出，void*类型的指针可以接收不同的类型的指针，但是无法直接进行指针运算。

那么void* 类型的指针有什么用呢？

一般 void* 类型的指针是使用在函数参数部分,用来接收不同类型的地址,这样的设计可以实现泛型编程的效果.使得一个函数来处理多种类型数据.

4.const修饰指针

4.1const修饰变量

变量是可以改变的，如果把变量的地址交给一个指针变量，通过指针变量来改变修改这个变量。但如果我们希望一个变量加上一些限制，不能被修改，怎么做呢？这就是const的作用了。

#include<stdio.h>

int main()
{
	int m = 10;
	m = 20;//m的值可以修改

	const int n = 10;
	n = 20;//n的值的不可修改

	return 0;
}

上述代码中n是不能被修改的，其实n本质是变量，只不过被const修饰后，在语法上加了限制，只要我们在代码中对n就行修改，就不符合语法规则，就报错，致使没法直接修改 n。

但如果我们绕过n，使用n的地址，去修改n就能够做到了，虽然这样是打破语法规则。

#include<stdio.h>

int main()
{
	const int n = 10;
	printf("n = %d\n", n);
	//
	int* pa = &n;
	*pa = 20;
	printf("n = %d\n", n);
	//
	return 0;
}

输出结果：

在这里插入图片描述
我们可以看到这里一个确实修改了，但是我们还是要思考一下，为什么n要被const修饰呢？就是为了不能被修改，如果p拿到n的地址就能修改n，这样就打破了const的限制，这是不合理的，所以应该让p拿到n的地址也不能修改n。

那接下来怎么做呢？

4.2const修饰指针变量

一般来讲，const 修饰指针变量，可以放在 * 的左边，也可以放在 * 的右边，但意义是不一样的。

int* p;//没有const修饰
int const* p;//const 放在*的左边
int* const p;//const 放在*的右边

看下面的代码，具体分析一下：

#include<stdio.h>
//代码1 - 测试无const的情况
void test1()
{
	int n = 10;
	int m = 20;
	//
	int* p = &n;
	*p = 20;//ok?
	p = &m;//ok?
	//
	printf("n = %d\n", n);//20
	printf("*p = %d\n", *p);//20

	return 0;
}

//测试const放在*的左边的情况
void test2()
{
	int n = 10;
	int m = 20;
	int const* p = &n;
	//
	*p = &n;//error
	p = &m;//ok??
	//
	printf("n = %d\n", n);
	printf("*p = %d\n", *p);
}

void test3()
{
	int n = 10;
	int m = 20;
	//
	int* const p = &n;
	*p = 20;//ok?
	p = &m;//error
	//
	printf("n = %d\n", n);
	printf("*p = %d\n", *p);

	return 0;
}

void test4()
{
	int n = 10;
	int m = 20;
	//
	int const* const p = &n;
	*p = 20;//error
	p = &m;//error
	//
	printf("n = %d\n", n);
	printf("*p = %d\n", *p);

	return 0;
}

int main()
{
	//测试没有const修饰的情况
	test1();
	//测试const放在*的左边的情况
	test2();
	//测试const放在*的右边的情况
	test3();
	//测试*的左右两边都有const修饰
	test4();

}

结论：const修饰指针变量的时候

const 如果放在 * 的左边，修饰的是指针指向的内容，保证指针指向的内容不能通过指针来改变，但指针变量本身的内容是可以改变的。
const 如果放在 * 的右边，修饰的是指针变量本身，保证了指针变量的内容不能修改，但是指针指向的内容，可以通过指针改变。

5.指针运算

指针的基本运算有三种，分别是：
指针 ± 整数
指针 - 指针
指针的关系运算

5.1指针 ± 整数

因为数组在内存中是连续存放的，只要知道第一个元素的地址，就可以找到后面的所有元素。

int arr[10] = { 1,2,3,4,5,6,7,8,9,10 };

在这里插入图片描述

#include<stdio.h>
//指针 +- 整数
int main()
{
	int arr[10] = { 1,2,3,4,5,6,7,8,9,10 };
	int* p = &arr[0];

	int i = 0;
	for (i = 0; i < 10; i++)
	{
		printf("%d ", *(p + i));//p+i 这里就是 指针 +-整数
	}

	return 0;
}

5.2指针 - 指针

指针 - 指针
#include<stdio.h>

int my_strlen(char* s)
{
	int count = 0;
	char* p = s;
	
	while (*p != '\0')
	{
		p++;
		count++;
	}
	return count;
}

int main()
{
	int len = my_strlen("abcdef");
	printf("%d\n", len);

	return 0;
}

5.3指针的关系运算

指针的关系运算
#include<stdio.h>

int main()
{
	int arr[10] = { 1,2,3,4,5,6,7,8,9,10 };
	int sz = sizeof(arr) / sizeof(arr[0]);
	int* p = &arr[0];
	
	while (p < arr + sz)//指针的关系运算
	{
		printf("%d ", *p);
		p++;
	}

	return 0;
}

6.野指针

概念：野指针就是只想的位置是不可知的（随机的、不正确的、没有明确限制的）

6.1野指针的形成

1.指针未初始化

#include<stdio.h>

int main()
{
	int* p;//局部变量指针未初始化，默认为随机值
	*p = 10;

	printf("*p = %d\n", *p);

	return 0;
}

2.指针越界访问

#include<stdio.h>

int main()
{
	int arr[10] = { 0 };
	int* p = &arr[0];

	int i = 0;
	for (i = 0; i < 11; i++)
	{
		//当指针指向的范围超出数组arr的范围时，p就是野指针
		*(p++) = i;
	}
	return 0;
}

3.指针指向的空间释放

#include<stdio.h>

int* test()
{
	int n = 10;
	return &n;
}

int main()
{
	int* p = test();
	printf("%d\n", *p);

	return 0;
}

6.2如何规避野指针

6.2.1指针的初始化

如果明确知道指针指向哪里就直接赋值地址，如果不知道指针应该指向哪里，可以给指针赋值NULL。NULL是C语言中定义的一个标识符常量，值是0，0也是地址，这个地址是无法使用的，读取改地址时会报错。

#ifdef __cplusplus
    #define NULL 0
#else
    #define NULL ((void *)0)
#endif

初始化如下：

#include<stdio.h>

int main()
{
	int num = 10;
	int* p1 = &num;
	int* p2 = NULL;

	return 0;
}

6.2.2小心指针越界

一个程序内存申请哪些空间，通过指针也就只能访问哪些空间，不能超出范围访问，超出了就是越界访问。

6.2.3指针不再使用时，及时置换为NULL，指针使用之前检查有效性

当指针变量指向一块区域的时候，我们可以通过指针访问该区域，后期不再使用这个指针访问空间的时候，我们可以把该指针置为NULL。因为约定俗成的一个规则就是：只要是NULL指针就不去访问，同时使用指针之前可以判断指针是否为NULL。
我们可以把野指针想象成野狗，野狗放任不管是非常危险的，所以我们可以找一棵树把野狗拴起来，就相对安全了，给指针变量及时赋值为NULL，其实就类似把野狗栓起来，就是把野指针暂时管理起来。
不过野狗即使拴起来我们也要绕着走，不能去挑逗野狗，有点危险；对于指针也是，在使用之前，我们也要判断是否为NULL，看看是不是被拴起来起来的野狗，如果是不能直接使用，如果不是我们再去使用。

举例：

#include<stdio.h>

int main()
{
	int arr[10] = { 1,2,3,4,5,6,7,8,9,10 };
	int* pa = &arr[0];

	for (int i = 0; i < 10; i++)
	{
		*(pa++) = i;
		//printf("%d ", *pa);
		//2 3 4 5 6 7 8 9 10 -858993460
	}
	//此时p已经越界了，可以把p设置为NULL
	pa = NULL;
	//下次在使用时，判断p不为NULL的时候再使用
	//示范：
	pa = &arr[0];
	if (pa != NULL);//判断
	{
		//...
	}

	return 0;
}

6.2.4避免返回局部变量的地址

如造成野指针的第3个例子，不要返回局部变量的地址。

7.assert断言

assert.h 头文件定义了宏 assert()，用于在运行是确保程序符合指定条件，如果不符合，就
报错终止运行。这个宏常常被称为“断言”。

assert(p != NULL);

上面的代码在程序运行到这一行语句时，验证变量p是否等于 NULL。如果确实不等于NULL，程序继续运行，否则就会终止运行，并且给出报错误的信息提示。

assert() 宏接受一个表达式作为参数。如果该表达式为真（返回值非零），assert() 不会产生任何作用，程序继续进行。如果该表达式为假（返回值为零），assert() 就会报错，在标准错误流 stderr 中写入一条错误信息，显示没有通过的表达式，以及包含这个表达式的文件名和行号。
assert() 的使用对程序员是非常友好的，使用 assert() 有几个好处：他不仅能自动表示文件和出问题的行号，还有一种无需更改代码就能开启或关闭 assert() 的机制，如果已经确定程序没有问题，不需要再做断言，就在 #include<assert.h> 语句前面，定义一个宏 NDEBUG (相当于一个开关)。

#define NDEBUG
#include <assert.h>

然后，重新编译程序，编译器就会禁用文件中的 assert() 语句。如果程序又出问题，可以移除这条 #define NDEBUG 指令（或者把它注释掉），再次编译，这样就重新启动了 assert()
assert() 的缺点是，因为引入了额外的检查，增加了程序运行时间。
一般我们可以在 Debug 中使用，在 Release 版本中禁用 assert 就行，在 VS这样的集成开发环境中，在 Release 版本中，直接就被优化掉了，这样在 Debug 版本写有利于程序排查问题，在 Release 版本中不影响用户使用的程序的效率。

8.指针的使用与传址调用

8.1strlen模拟实现

库函数strlen的功能是求字符串长度，统计的是字符串中 \0 之前的字符的个数。

函数原型如下：

size_t strlen(const char* str);

参数str接收一个字符的起始地址，然后开始统计字符串中 \0 之前的字符个数，最终返回长度。
如果要模拟实现只要从起始地址开始向后逐个字符的遍历，只要不是 \0 字符，计数器就+1，知道遇到 \0 就停止。

代码如下：

#include<stdio.h>
#include<assert.h>

int my_strlen(char* s)
{
	assert(s);
	int count = 0;
	while (*s)
	{
		count++;
		s++;
	}
	return count;
}

int main()
{
	int len = my_strlen("abcdef");
	printf("len = %d", len);

	return 0;
}

8.2传值调用和传址调用

学习指针的目的是使用指针决解问题，那什么问题，非指针不可？

例子：写一个函数，交换两个整型变量的值

代码1：

//第一种：传值调用
#include<stdio.h>

void Swap(int x, int y)
{
	int tmp = x;
	x = y;
	y = tmp;
}

int main()
{
	int a = 10;
	int b = 20;

	printf("交换前：a = %d b = %d\n", a, b);
	//交换
	Swap(a, b);

	printf("交换后：a = %d b = %d\n", a, b);

	return 0;
}

结果如下：
在这里插入图片描述
我们发现，其实并没有产生交换的效果，这是为什么?

调试一下：
在这里插入图片描述

我们发现在main函数内部，创建了a和b，a的地址是0x0000002f5814fb14，b的地址是0x0000002f5814fb34，在调⽤Swap1函数时，将a和b传递给了Swap1函数，在Swap1函数内部创建了形参x和y接收a和b的值,但是x的地址是0x0000002f5814faf0，y的地址是0x0000002f5814faf8，x和y确实接收到了a和b的值，不过x的地址和a的地址不一样，y的地址和b的地址不⼀样，相当于x和y是独立的空间，那么在Swap1数内部交换x和y的值，自然不会影响a和b，当Swap1函数调用结束后回到main函数，a和b的没法交换。Swap1函数在使用的时候，是把变量本身直接传递给了函数，这种调用函数的方式我们之前在函数的时候就知道了，这种叫传值调用。

结论：
实参传给形参的时候，形参会单独创建一份临时空间来接收实参，对形参的修改不影响实参。

所以代码1无法实现两个整型的交换。

那怎么办呢？

我们现在要解决的就是当调用Swap函数的时候，Swap函数内部操作的就是main函数中的a和b，直接将a和b的值交换了。那么就可以使用指针了，在main函数中将a和b的地址传递给Swap函数，Swap函数里边通过地址间接的操作main函数中的a和b，并达到交换的效果就好了。

代码2：

//第二种：传址调用
#include<stdio.h>

void Swap(int* x, int* y)
{
	int tmp = *x;
	*x = *y;
	*y = tmp;
}

int main()
{
	int a = 10;
	int b = 20;

	printf("交换前：a = %d b = %d\n", a, b);
	//交换
	Swap(&a, &b);

	printf("交换后：a = %d b = %d\n", a, b);

	return 0;
}

结果如下：
在这里插入图片描述

我们可以看到实现Swap的方式，顺利完成了任务，这里的调用Swap函数的时候是将变量的地址传递给函数，这种函数调用方式叫：传址调用。
传址调用，可以让函数和主调函数之间建立真正的联系，在函数内部可以修改主调函数中的变量。
所以未来函数中只是需要主调函数中的变量值来实现计算，就可以采用传值调用。如果函数内部要修改主调函数中的变量的值，就需要传址调用。

Joseit

关注

23
点赞
踩
28

收藏

觉得还不错? 一键收藏
1
评论
C语言.指针的基本语法（1）

我们知道计算机上CPU（中央处理器）在处理数据的时候，需要的数据是在内存中读取的。处理后的数据也会放回内存中。那我们买电脑的时候，电脑上内存是8G/16G/32G等，那这些内存空间如何高效的管理？其实，每一个内存单元，一个字节空间里面能放，而每个内存单元也都是有一个编号，有了这个内存单元的编号，。在计算机中我们把。
复制链接

扫一扫