windows 和 linux 下c/c++内存分布(整理)

http://www.eetop.cn/blog/html/21/200421-23764.html

C程序一般分为

1.程序段(text:  程序段为程序代码在内存中的映射.一个程序可以在内存中多有个副本.

2.文字常量区: 常量字符串就是放在这里的。

3.初始化过的数据(data):  在程序运行之初已经对变量进行初始化的.全局变量和静态变量的存储是放在一块的,初始化的全局变量和静态变量在一块区域, 未初始化的全局变量和未初始化的静态变量在相邻的另一块区域。

4.未初始化过的数据(bss: 在程序运行初未对变量进行初始化的数据。

6.堆栈(stack): 存储局部,临时变量,在程序块开始时自动分配内存,结束时自动释放内存.存储函数的返回指针当函数被调用时,它们被压入栈;当函数返回时,它们就要被弹出堆栈。

7.(heap): 存储动态内存分配,需要程序员手工分配(cmalloc函数,c++new函数),手工释放(free  delete 函数).

34称为静态存储区,67称为动态存储区。

 

windows进程中的内存结构

#include <stdio.h>

#include <string.h>

 

int a = 0; //全局初始化区

char *p1; //全局未初始化区

main()

{

int b; //

char s[] = "abc"; //

char *p2; //

char *p3 = "123456";// 123456\0在常量区,p3在栈上。

static int c =0;// 全局(静态)初始化区

static int uc,uc1,uc2;// 全局(静态)未初始化区

p1 = (char *)malloc(10);

p2 = (char *)malloc(20);

//分配得来得1020字节的区域就在堆区。

strcpy(p1, "123456");// 123456\0放在常量区,编译器可能会将它与p3所指向的"123456"优化成一个地方。

 

printf("p1 \t\t\t0x%08x\n",p1);

printf("p2 \t\t\t0x%08x\n",p2);

printf("&p3 \t\t\t0x%08x\n",&p3);

printf("&p2 \t\t\t0x%08x\n",&p2);

printf("s \t\t\t0x%08x\n",s);

printf("&s[1] \t\t0x%08x\n",&s[1]);

printf("&b \t\t\t0x%08x\n",&b);

printf("main地址\t\t0x%08x\n",main);

printf("文本常量区\t\t0x%08x\n",p3);

printf("全局初始化区\t\t0x%08x\n",&a);

printf("静态初始化区\t0x%08x\n",&c);

printf("全局未初始化区\t\t0x%08x\n",&p1);

printf("静态未初始化区\t0x%08x\n",&uc);

printf("静态未初始化区\t0x%08x\n",&uc1);

printf("静态未初始化区\t0x%08x\n",&uc2);

}

你可以看到这些变量在内存是连续分布的,但是本地变量和全局变量分配的内存地址差了十万八千里,而全局变量和静态变量分配的内存是连续的。这是因为本地变量和全局/静态变量是分配在不同类型的内存区域中的结果。对于一个进程的内存空间而言,可以在逻辑上分成3个部份:代码区,静态数据区和动态数据区。动态数据区一般就是“堆栈”。“栈(stack)”和“堆(heap)”是两种不同的动态数据区,栈是一种线性结构,堆是一种链式结构。进程的每个线程都有私有的“栈”,所以每个线程虽然代码一样,但本地变量的数据都是互不干扰。一个堆栈可以通过“基地址”和“栈顶”地址来描述。全局变量和静态变量分配在静态数据区,本地变量分配在动态数据区,即堆栈中。程序通过堆栈的基地址和偏移量来访问本地变量。

 

 

├———————┤低端内存区域

 …… 

├———————┤

 动态数据区 

├———————┤

 …… 

├———————┤

 代码区 

├———————┤

 静态数据区 

├———————┤

 …… 

├———————┤高端内存区域

堆栈是一个先进后出的数据结构,栈顶地址总是小于等于栈的基地址。

 

linux c程序存储空间布局

进程在内存中的影像.

      我们假设现在有一个程序它的函数调用顺序如下.

      main(...) ->; func_1(...) ->; func_2(...) ->; func_3(...)

      主函数main调用函数func_1; 函数func_1调用函数func_2; 函数func_2调用函数func_3

      当程序被操作系统调入内存运行其相对应的进程在内存中的影像如下图所示.

        (内存高址)

        +--------------------------------------+

        |             ......                   |  ... 省略了一些我们不需要关心的区

        +--------------------------------------+

        |  env strings (环境变量字串)          | \

        +--------------------------------------+  \

        |  argv strings (命令行字串)           |   \

        +--------------------------------------+    \

        |  env pointers (环境变量指针)         |    SHELL的环境变量和命令行参数保存区

        +--------------------------------------+    /

        |  argv pointers (命令行参数指针)      |   /

        +--------------------------------------+  /

        |  argc (命令行参数个数)               | /

        +--------------------------------------+

        |            main 函数的栈帧           | \

        +--------------------------------------+  \

        |            func_1 函数的栈帧         |   \

        +--------------------------------------+    \

        |            func_2 函数的栈帧         |     \

        +--------------------------------------+      \

        |            func_3 函数的栈帧         |      Stack ()

        +......................................+      /

        |                                      |     /

                      ......                        /

        |                                      |   /

        +......................................+  /

        |            Heap ()                 | /

        +--------------------------------------+

        |        Uninitialised (BSS) data      |  非初始化数据(BSS)

        +--------------------------------------+

        |        Initialised data              |  初始化数据区

        +--------------------------------------+

        |        Text                          |  文本区

        +--------------------------------------+

        (内存低址)

        这里需要说明的是:

        i)   随着函数调用层数的增加函数栈帧是一块块地向内存低地址方向延伸的.              随着进程中函数调用层数的减少即各函数调用的返回栈帧会一块块地              被遗弃而向内存的高址方向回缩各函数的栈帧大小随着函数的性质的不同而不等由函数的局部变量的数目决定.

        ii)  进程对内存的动态申请是发生在Heap()里的也就是说随着系统动态分配给进程的内存数量的增加, Heap()有可能向高址或低址延伸依赖于不             CPU的实现但一般来说是向内存的高地址方向增长的堆和栈相向而生,堆和栈之间有个临界点,称为stkbrk.

        iii) BSS数据或者Stack()的增长耗尽了系统分配给进程的自由内存的情况下进程将会被阻塞重新被操作系统用更大的内存模块来调度运行.              (虽然和exploit没有关系但是知道一下还是有好处的)

        iv)  函数的栈帧里包含了函数的参数(至于被调用函数的参数是放在调用函数的栈帧还是被调用函数栈帧则依赖于不同系统的实现),它的局部变量以及恢复调用该函数的函数的栈帧(也就是前一个栈帧)所需要的数据其中包含了调用函数的下一条执行指令的地址.

        v)   非初始化数据(BSS)区用于存放程序的静态变量这部分内存都是被初始化为零的初始化数据区用于存放可执行文件里的初始化数据这两个区统称为数据区.

        vi)  Text(文本区)是个只读区任何尝试对该区的写操作会导致段违法出错文本区是被多个运行该可执行文件的进程所共享的文本区存放了程序的代码.

    2) 函数的栈帧.

       函数调用时所建立的栈帧包含了下面的信息:

       i)   函数的返回地址返回地址是存放在调用函数的栈帧还是被调用函数的栈帧里取决于不同系统的实现.




展开阅读全文

没有更多推荐了,返回首页