main函数执行之前都干啥了----C/C++运行时库剖析

本文转载 http://www.cnblogs.com/yueqian-scut/p/3952263.html,感谢原作者分享,若构成侵权,及时告知,立刻删除。

1. 引言

本文介绍运行时库实现的功能,你会看到在main函数执行之前都做了什么。先来理解以下代码:

#include <stdio.h>

void init(void) __attribute__((constructor));
void init(void){
    printf(“before enter main!\n”);
}

void exit_func(void){
    printf(“after leave main!\n”);
}

int main(void){
    int *m = malloc(5, sizeof(int));
    atexit(exit_fun);
    printf(“hello world!\n”);
}

思考:

 1. 程序的运行结果是?
 2. 进入main之前做了哪些操作,如果进入main?
 3. 如何支持printf函数?
 4. 退出main之后做了什么事情?
 5. 如何MALLOC和FREE等堆操作?
 6. 程序会造成内存泄露吗?
 7. 等等

2. 运行时库概述

任何一个C/C++程序,它的背后都有一套庞大的代码来进行支撑,以使得该程序能够正常运行。这套代码至少包括入口函数,及其依赖的函数所构成的函数集合。当然,它还应该包括各种标准函数(如字符串,数学运算等)的实现。一般的程序运行过程如下:

1. 操作系统创建进程后,把控制权交给程序的入口函数(gcc –e (_startEntryPoint)),   这个函数往往是运行时库的某个入口函数。 glibc 的入口函数是_start, msvc(vc6.0)是mainCRTStartup
2. 入口函数对运行库和程序运行环境进行初始化,包括堆,I/O,线程,全局变量构造(constructor)等。
3. 调用MAIN函数,正式开始执行程序主体。
4. 执行MAIN完毕,返回入口函数,进行清理工作,包括全局变量析构,堆销毁,关闭I/O等,然后进行系统调用介绍进程

3. 运行时库主要功能模块

1.启动与退出,包括入口函数及其依赖函数
2.标准函数,C语言标准规定的标准函数
3.I/O,I/O功能的封装和实现,如提供PRINT
4.堆,堆的封装和实现
5.调试支持等

4. 程序详细运行过程

以下分析默认为WINDOWS静态链接过程。

1. 程序执行前装载器会把用户的参数和环境变量压入栈,接着操作系统把**控制权**交给 mainCRTStartup **入口函数**。

用户的参数:对应int main(int argc,char *argv[])
环境变量:系统公用数据,系统搜索路径等等。
程序需要获取用户参数和环境变量均是 从栈上获取,需要理解栈帧的概念。

2. 初始化和OS版本相关的**全局变量**

3. **初始化堆**,每个进程都有属于自己的堆。它是一次性从系统中申请一块比较大的虚拟空间(实际需要时(如malloc)才会映射到物理页),以后在进程中由库的堆管理算法来维护这个堆。当堆不够用时再继续申请一块大的虚拟空间继续分配。 可见,并非程序每次malloc都会调用系统API(API调用比较耗时,涉及到用户态到内核态的上下文切换),效率比较高.

堆相关操作
HeapCreate:创建一个堆,最终会调用virtualAlloc()系统API函数去创建堆。
HeapAlloc: malloc会调用该函数
HeapFree: free会调用该函数
HeapDestroy:摧毁一个堆

4. I/O初始化,继承父进程打开文件表。可见,子进程是可以访问父进程打开的文件。如果父进程没有打开标准的输入输出,该进程会初始化标准输入输出。即初始化以下指针变量:stdin,stdout,stderr.它们都是FILE类型指针。在linux和windows中,打开文件对应于操作一个内核对象,其处于内核态,因此用户态是不能直接操作该内核对象的。用户只能操作与内核对象相关联的FILE结构指针。对应关系是:

这里写图片描述

printf其实是调用stdout指针在屏幕上输出

#define printf(args…) fprintf(stdout, ##args)

Args…表示变长输入参数。用以下四个宏根据栈来获取。
Va_list、Va_start、Va_arg、Va_end

5. 获取命令行参数和环境变量

6. 初始化C库的一些数据

7. 全局变量构造,如各个全局类对象的构造函数调用和标记 __attribute__((constructor))属性的各个函数。它们都应该在进入main前进行调用。

需要运行时库和C/C++编译器、连接器的配合才能实现这个功能。

1)编译器编译某个.cpp(设为main.cpp)文件时,会将所有的构造函数实现作为一个整体放到.init段,把析构函数实现放到.finit段,然后在.ctors段放置.init段的地址(该地址即是该文件的各个构造函数的总入口)。
2)运行时库有一个库是crtbegin.o,它的.ctors段放置的内容为-1,ctrend.o,它的.ctors段放置的内容也是-1。
3)用链接器进行连接:ld crtbegin.o main.o crtend.o一定要按这种顺序,否则出错。链接后的.ELF文件是将以上各个文件的.init/.finit/.ctors等段分别合并。当然.data/.text段也会相应合并。
全局变量构造时即是遍历.ctors段的内容,从-1(crtbegin.o)开始,再到-1(crtend.o)结束,中间每四个字节即是各个文件的构造入口函数指针,如果非0,即进行调用。

8. 注册析构函数

为了支持C++类的析构函数,和标记 attribute((deconstructor))属性的各个函数在main之后会被调用,而且是按构造的相反顺序进行调用,同样需要编译器和链接器以及运行时库的支持,原理跟构造相仿。只是为了逆序,使用了atexit注册各个虚构函数,注册时在链表头插入链接,main退出以后也从链表头开始获取链表函数,并进行调用。

9. 执行函数主体。

调用main函数执行,等待返回。在这里可以用到之前已经初始化的各种资源,如I/O, 堆申请释放等等

10. 调用析构函数
11. 释放堆
12. 释放其他资源
13. 调用exit系统API退出进程

5. 回答引言的问题。

1. 参考以上分析, 程序的打印结果是:
 before enter main!
 hello world!
 after leave main!
2. 程序并不会产生系统内存泄漏。进程退出,其会摧毁整个堆。所谓内存泄露是指在进程的运行中,不恰当、不合理地申请内存,但没有释放内存。
获取网络包需要使用一些底层的操作,例如使用套接字(socket)和网络接口卡(NIC)等。下面是获取网络包的一般步骤: 1. 创建套接字:使用`socket()`函数创建一个套接字,指定协议类型和套接字类型。 2. 绑定套接字:使用`bind()`函数将套接字绑定到一个本地的IP地址和端口号上。 3. 设置过滤规则:使用`setsockopt()`函数设置套接字选项,指定过滤规则,例如只接收某个IP地址或端口号的网络包。 4. 接收网络包:使用`recvfrom()`函数接收从网络上接收到的数据包,可以指定缓冲区大小和发送端的IP地址和端口号等信息。 5. 处理网络包:对接收到的网络包进行解析和处理,例如提取数据部分或者进行协议分析等。 下面是一个简单的示例代码,用于获取网络包: ```c++ #include <sys/socket.h> #include <netinet/in.h> #include <arpa/inet.h> int main() { int sockfd; struct sockaddr_in addr; char buffer[1024]; ssize_t n; // 创建套接字 if ((sockfd = socket(AF_INET, SOCK_DGRAM, 0)) < 0) { perror("socket"); return -1; } // 绑定套接字 memset(&addr, 0, sizeof(addr)); addr.sin_family = AF_INET; addr.sin_addr.s_addr = htonl(INADDR_ANY); addr.sin_port = htons(12345); if (bind(sockfd, (struct sockaddr *)&addr, sizeof(addr)) < 0) { perror("bind"); return -1; } // 设置过滤规则 struct sockaddr_in src_addr; socklen_t addrlen = sizeof(src_addr); memset(&src_addr, 0, sizeof(src_addr)); src_addr.sin_family = AF_INET; src_addr.sin_addr.s_addr = inet_addr("192.168.1.1"); if (setsockopt(sockfd, SOL_SOCKET, SO_BINDTODEVICE, "eth0", strlen("eth0")) < 0) { perror("setsockopt"); return -1; } // 接收网络包 while ((n = recvfrom(sockfd, buffer, sizeof(buffer), 0, (struct sockaddr *)&src_addr, &addrlen)) >= 0) { // 处理网络包 // ... } // 关闭套接字 close(sockfd); return 0; } ``` 这段代码使用UDP协议从本地接收网络包,并设置过滤规则只接收来自192.168.1.1地址的数据包。在实际使用中,还需要对接收到的网络包进行解析和处理,例如解码、加密、验证等。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值