Linux系统中程序是如何执行的？

最新推荐文章于 2024-08-14 21:58:44 发布

悲剧的开始哟

最新推荐文章于 2024-08-14 21:58:44 发布

阅读量993

点赞数 8

文章标签： linux

本文链接：https://blog.csdn.net/qq_41764707/article/details/140248048

版权

在Linux系统中，程序的执行是一个复杂的过程，涉及多个关键步骤，包括进程的创建、可执行程序的加载、程序的执行以及进程的调度等。以下是对这些步骤的详细描述：

1. 进程的创建

在Linux系统中，进程的创建通常是通过fork系统调用完成的。fork调用会创建一个新的进程，该进程几乎是父进程的完全复制品。这个新进程称为子进程，子进程和父进程之间共享同一个代码段，但数据段和堆栈段是独立的。

1.1 fork系统调用

fork是一个POSIX标准的系统调用，用于创建一个新的进程。它通过复制当前进程的地址空间来创建一个新的子进程。父进程和子进程之间的主要区别是返回值：在父进程中，fork返回子进程的PID；在子进程中，fork返回0。

#include <unistd.h>
#include <stdio.h>

int main() {
    pid_t pid = fork();
    if (pid == 0) {
        printf("This is the child process.\n");
    } else if (pid > 0) {
        printf("This is the parent process. Child PID: %d\n", pid);
    } else {
        perror("fork failed");
    }
    return 0;
}

在这个例子中，如果fork调用成功，父进程和子进程都会执行各自的代码块。父进程可以通过返回的子进程PID来区分不同的子进程。

1.2 vfork系统调用

vfork是fork的一个变种，用于在某些特定情况下提高性能。与fork不同，vfork创建的子进程会共享父进程的地址空间，直到子进程调用exec或exit。这意味着在调用exec或exit之前，子进程不应该修改父进程的地址空间。

#include <unistd.h>
#include <stdio.h>

int main() {
    pid_t pid = vfork();
    if (pid == 0) {
        // 子进程执行新程序
        execl("/bin/ls", "ls", (char *)NULL);
    } else if (pid > 0) {
        printf("This is the parent process. Child PID: %d\n", pid);
    } else {
        perror("vfork failed");
    }
    return 0;
}

在这个例子中，子进程通过vfork创建，并执行ls命令。

2. 可执行程序的加载

子进程创建后，可以通过exec族函数（如execl, execp, execv, execve等）加载一个新的可执行程序。这些函数会用新程序替换当前进程的内容，而进程ID保持不变。

2.1 exec族函数

exec族函数包括多种形式，每种形式适用于不同的场景：

execl: 接受可变参数列表
execv: 接受参数数组
execlp: 在PATH环境变量中搜索可执行文件
execvp: 在PATH环境变量中搜索可执行文件，并接受参数数组

#include <unistd.h>
#include <stdio.h>

int main() {
    pid_t pid = fork();
    if (pid == 0) {
        // 子进程执行新程序
        execl("/bin/ls", "ls", (char *)NULL);
        perror("execl failed");
    } else if (pid > 0) {
        printf("This is the parent process. Child PID: %d\n", pid);
    } else {
        perror("fork failed");
    }
    return 0;
}

在这个例子中，子进程使用execl函数加载并执行ls命令。如果exec调用失败，perror函数会输出错误信息。

2.2 exec函数的工作原理

exec函数族调用后，当前进程的地址空间会被新程序的地址空间替换。这意味着当前进程的所有代码、数据和堆栈都会被新程序的代码、数据和堆栈替换，但进程ID保持不变。exec调用成功后不会返回，因为进程的内容已经完全改变；如果exec调用失败，返回-1，并设置errno以指示错误类型。

3. 程序的执行

当一个新程序被加载到进程中时，操作系统会将控制权交给新程序的入口点。程序的执行从入口点开始，按照预定的程序逻辑依次执行各条指令。

3.1 程序入口点

在C语言程序中，入口点通常是main函数。程序执行从main函数开始，直到main函数返回或调用exit函数结束。

#include <stdio.h>

int main(int argc, char *argv[]) {
    printf("Program started\n");
    // 其他程序逻辑
    return 0;
}

在这个例子中，程序从main函数开始执行，打印消息后返回0，表示程序正常结束。

3.2 进程的地址空间

每个进程都有独立的地址空间，包括代码段、数据段、堆和栈。Linux通过进程地址空间的隔离保证了进程之间的独立性和安全性。

代码段：存储程序的可执行代码。
数据段：存储已初始化的全局变量和静态变量。
bss段：存储未初始化的全局变量和静态变量。
堆：用于动态分配内存。
栈：用于函数调用和局部变量。

#include <stdio.h>
#include <stdlib.h>

int global_var = 1; // 数据段

int main() {
    int local_var = 2; // 栈
    int *heap_var = (int *)malloc(sizeof(int)); // 堆
    *heap_var = 3;

    printf("Global: %d, Local: %d, Heap: %d\n", global_var, local_var, *heap_var);

    free(heap_var); // 释放堆内存
    return 0;
}

在这个例子中，全局变量global_var位于数据段，局部变量local_var位于栈，动态分配的heap_var位于堆。

4. 进程的调度

Linux内核使用调度程序来管理进程的执行。调度程序决定哪个进程在任何给定时刻运行。Linux使用多种调度算法，包括时间片轮转、完全公平调度等，以确保系统的响应性和公平性。

4.1 调度算法

时间片轮转（Round Robin）：每个进程分配一个时间片，时间片用完后切换到下一个进程。
完全公平调度（Completely Fair Scheduler, CFS）：根据进程的虚拟运行时间（virtual runtime, vruntime）进行调度，确保每个进程得到公平的CPU时间。

4.2 优先级

每个进程都有一个优先级，调度程序根据优先级来选择下一个要运行的进程。优先级越高，进程获得的CPU时间越多。系统调用nice和renice可以用来调整进程的优先级。

#include <stdio.h>
#include <unistd.h>

int main() {
    int nice_value = nice(10); // 提高当前进程的优先级
    printf("Nice value: %d\n", nice_value);
    // 其他程序逻辑
    return 0;
}