(一)引入
- 程序执行需要内存支持
- 对程序来说,内存就是程序的立足之地(程序是被放在内存中运行的);程序运行时需要内存来存储一些临时变量。
- 内存管理最终是由操作系统完成的
- (1)内存本身在物理上是一个硬件器件,由硬件系统提供。
- (2)内存是由操作系统统一管理。为了内存管理方便又合理,操作系统提供了多种机制来让我们应用程序使用内存。这些机制彼此不同,各自有各自的特点,我们程序根据自己的实际情况来选择某种方式获取内存(在操作系统处登记这块内存的临时使用权限)、使用内存、释放内存(向操作系统归还这块内存的使用权限)。
- 三种内存来源:栈(stack)、堆(heap)、数据区(.data)
(二)栈(stack)
栈的特点
运行时自动分配&自动回收 | 栈是自动管理的,程序员不需要手工干预。方便简单。 |
---|---|
反复使用 | 栈内存在程序中其实就是那一块空间,程序反复使用这一块空间。 |
脏内存 | 栈内存由于反复使用,每次使用后程序不会去清理,因此分配到时保留原来的值。 |
临时性 | (函数不能返回栈变量的指针,因为这个空间是临时的) |
栈会溢出 | 因为操作系统事先给定了栈的大小,如果在函数中无穷尽的分配栈内存总能用完。 |
- 脏内存:这也解释了为什么当定义一个栈变量后,不对栈变量进行初始化赋值,那么访问栈变量的值是结果是一个垃圾值
/*
*描述:函数不能返回栈变量的指针举例
*/
#include <stdio.h>
int *func1(void)
{
int a = 5; //a 是局部变量,又叫栈变量,分配在栈上,又叫临时变量
return &a; // warning: function returns address of local variable [-Wreturn-local-addr]
} //警告:函数返回局部变量的地址
//编译器警告,因为a分配在栈中,当函数执行完返回后,局部变量a已经不存在了,虽然可以访问,
//但这个地址已经和a没有关系了。所以函数不能返回栈变量的指针。
void func2(void)
{
int a = 1;
int b = 2;
}
int main (void)
{
int *p = NULL;
p = func1();
printf("a = %d.\n", *p);
func2();
printf("a = %d.\n", *p);
return 0;
}
(三)堆(heap)
- 操作系统堆管理器管理:堆管理器是操作系统的一个模块,堆管理内存分配灵活,按需分配。
大块内存 | 堆内存管理者总量很大的操作系统内存块,各进程可以按需申请使用,使用完释放。 |
---|---|
程序手动申请&释放 | 手工意思是需要写代码去申请malloc和释放free。 |
脏内存 | 堆内存也是反复使用的,而且使用者用完释放前不会清除,因此也是脏的。 |
临时性 | 堆内存只在malloc和free之间属于我这个进程,而可以访问。在malloc之前和free之后都不能再访问,否则会有不可预料的后果。 |
#include <stdio.h>
#include <stdlib.h>
int main (void)
{
//第一步:申请分配和绑定
int *p = (int *)malloc(sizeof(int) * 1000);
//第二步:检查申请是否成功
if(p == NULL)
{
printf("malloc error\n");
return -1;
}
//第三步:使用申请到的内存
p = NULL;//malloc 申请内存后,在free之前不能给p赋其他值,
//因为malloc后获取的地址和p绑定,p是这段内存的唯一联系人
//如果p丢失(即值被改变),那么这段内存将丢失,无法找回,
//丢了的概念就是,在操作系统的堆管理器中这段内存是当前进程拿着的,
//但是你也用不了
//要想使用内存就需要重新申请,这就叫程序'吃内存'。
*(p + 0) = 1;
*(p + 110) = 2;
printf("*(p + 0) = %d.\n", *(p + 0));
printf("*(p + 110) = %d.\n", *(p + 110));
//第四步:使用完后,释放
free(p);
return 0;
}
-
malloc使用注意
- (1)void *是个指针类型,malloc返回的是一个void *类型的指针,实质上malloc返回的是堆管理器分配给我本次申请的那段内存空间的首地址(malloc返回的值其实是一个数字,这个数字表示一个内存地址)。为什么要使用void *作为类型?主要原因是malloc帮我们分配内存时只是分配了内存空间,至于这段空间将来用来存储什么类型的元素malloc是不关心的,由我们程序自己来决定。
- (2)什么是void类型。早期被翻译成空型,这个翻译非常不好,会误导人。void类型不表示没有类型,而表示万能类型。void的意思就是说这个数据的类型当前是不确定的,在需要的时候可以再去指定它的具体类型。void *类型是一个指针类型,这个指针本身占4个字节,但是指针指向的类型是不确定的,换句话说这个指针在需要的时候可以被强制转化成其他任何一种确定类型的指针,也就是说这个指针可以指向任何类型的元素。
- (3)malloc的返回值:成功申请空间后返回这个内存空间的指针,申请失败时返回NULL。所以malloc获取的内存指针使用前一定要先检验是否为NULL。
- (4)malloc申请的内存时用完后要free释放。free§;会告诉堆管理器这段内存我用完了你可以回收了。堆管理器回收了这段内存后这段内存当前进程就不应该再使用了。因为释放后堆管理器就可能把这段内存再次分配给别的进程,所以你就不能再使用了。
- (5)再调用free归还这段内存之前,指向这段内存的指针p一定不能丢(也就是不能给p另外赋值)。因为p一旦丢失这段malloc来的内存就永远的丢失了(内存泄漏),直到当前程序结束时操作系统才会回收这段内存。
-
malloc的一些细节表现
- malloc(0):malloc申请0字节内存本身就是一件无厘头事情,一般不会碰到这个需要。
如果真的malloc(0)返回的是NULL还是一个有效指针?答案是:实际分配了16Byte的一段内存并且返回了这段内存的地址。这个答案不是确定的,因为C语言并没有明确规定malloc(0)时的表现,由各malloc函数库的实现者来定义。 - malloc(4):==gcc中的malloc默认最小是以16B为分配单位的。如果malloc小于16B的大小时都会返回一个16字节的大小的内存。==malloc实现时没有实现任意自己的分配而是允许一些大小的块内存的分配。
- malloc(20):去访问第25、第250、第2500····会怎么样,实战中:120字节处正确,1200字节处正确····终于继续往后访问总有一个数字处开始段错误了。
- malloc(0):malloc申请0字节内存本身就是一件无厘头事情,一般不会碰到这个需要。
(四)数据区(.data)
编译器在编译程序的时候,将程序中的所有的元素分成了一些组成部分,各部分构成一个段,所以说段是可执行程序的组成部分。
代码段 | 代码段就是程序中的可执行部分,直观理解代码段就是函数堆叠组成的。 |
---|---|
数据段(也被称为数据区、静态数据区、静态区) | 数据段就是程序中的数据,直观理解就是C语言程序中的全局变量。(注意:全局变量才算是程序的数据,局部变量不算程序的数据,只能算是函数的数据) |
bss段(又叫ZI(zero initial)段) | bss段的特点就是被初始化为0,bss段本质上也是属于数据段,bss段就是被初始化为0的数据段。 |
- 有些特殊数据会被放到代码段
- C语言中使用char *p = “linux”;定义字符串时,字符串"linux"实际被分配在代码段,也就是说这个"linux"字符串实际上是一个常量字符串而不是变量字符串。
- const型常量:C语言中const关键字用来定义常量,常量就是不能被改变的量。const的实现方法至少有2种:第一种就是编译将const修饰的变量放在代码段去以实现不能修改(普遍见于各种单片机的编译器);第二种就是由编译器来检查以确保const型的常量不会被修改,实际上const型的常量还是和普通变量一样放在数据段的(gcc中就是这样实现的)。
注意区分:数据段(.data)和bss段的区别和联系:二者本来没有本质区别,都是用来存放C程序中的全局变量的。区别在于把显示初始化为非零的全局变量存在.data段中,而把显式初始化为0或者并未显式初始化(C语言规定未显式初始化的全局变量值默认为0)的全局变量存在bss段。
- 显式初始化为非零的全局变量和静态局部变量放在数据段
- 放在.data段的变量有2种:第一种是显式初始化为非零的全局变量。第二种是静态局部变量,也就是static修饰的局部变量。(普通局部变量分配在栈上,静态局部变量分配在.data段)
- 未初始化或显式初始化为0的全局变量放在bss段
- bss段和.data段并没有本质区别,几乎可以不用明确去区分这两种。
/*
*描述:展示三种分配变量的方式
*/
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
char str[] = "linux"; //第三种方法:定义定义成全局变量,放在数据段中
int main (void)
{
char a[] = "linux"; //第一种方法:定义成局部变量,放在栈中
char *p = "linux";
char *p1 = (char *)malloc(sizeof(char) * 10); //第二种方法:放在malloc申请的堆内存中
if (NULL == p)
{
printf("malloc error.\n");
return 0;
}
memset(p1, 0, 10);
strcpy(p1, "linux");
printf("a = %s.\n", a);
printf("a = %p.\n", a);
printf("str = %s.\n", str);
printf("str = %p.\n", str);
printf("p1 = %s.\n", p1);
printf("p1 = %p.\n", p1);
return 0;
}
(五)总结
- 总结:C语言中所有变量和常量所使用的内存无非以上三种情况。
- 相同点:三种获取内存的方法,都可以给程序提供可用内存,都可以用来定义变量给程序用。
- 不同点:栈内存对应C中的普通局部变量(别的变量还用不了栈,而且栈是自动的,由编译器和运行时环境共同来提供服务的,程序员无法手工控制);堆内存完全是独立于我们的程序存在和管理的,程序需要内存时可以去手工申请malloc,使用完成后必须尽快free释放。(堆内存对程序就好象公共图书馆对于人);数据段对于程序来说对应C程序中的全局变量和静态局部变量。
- 如果我需要一段内存来存储数据,我究竟应该把这个数据存储在哪里?(或者说我要定义一个变量,我究竟应该定义为局部变量还是全局变量还是用malloc来实现)。不同的存储方式有不同的特点,简单总结如下:
- 函数内部临时使用,出了函数不会用到,就定义局部变量
- ==堆内存和数据段几乎拥有完全相同的属性,大部分时候是可以完全替换的。但是生命周期不一同,
堆内存的生命周期是从malloc开始到free结束,而全局变量是从整个程序一开始执行就开始,
直到整个程序结束才会消灭,伴随程序运行的一生。==启示:如果你这个变量只是在程序的一个
阶段有用,用完就不用了,就适合用堆内存;如果这个变量本身和程序是一生相伴的,那就
适合用全局变量。(堆内存就好象租房、数据段就好象买房。堆内存就好象图书馆借书,数
据段就好象自己书店买书)你以后会慢慢发现:买不如租,堆内存的使用比全局变量广泛。