进程的基本概念（下）-- 环境变量与进程地址空间-CSDN博客

本文链接：https://blog.csdn.net/weixin_72481085/article/details/140360183

进程的概念

文章目录

进程的概念

四. 环境变量

4.1 基本概念

环境变量(environment variables)一般是指在操作系统中用来指定操作系统运行环境的一些参数
如：我们在编写C/C++代码的时候，在链接的时候，从来不知道我们的所链接的动态静态库在哪里，但
是照样可以链接成功，生成可执行程序，原因就是有相关环境变量帮助编译器进行查找。
环境变量通常具有某些特殊用途，还有在系统当中通常具有全局特性
环境变量不是一个，而是一堆，彼此其实没有关系，一般是系统内置的具有特殊用途的变量
环境变量具有全局属性，会被所有的子进程包括孙子进程继承

什么是变量？

定义变量的本质其实是开辟空间，在运行期间我们也可以开辟空间

操作系统/bash是用C语言写的程序，在它运行的过程中也可以开辟空间定义变量吗？

可以；系统的环境变量本质就是系统自己开辟空间，放入内容。

main参数 – 命令行参数

我们可以通过不同的选项来执行程序内部不同的代码功能

命令行参数，是Linux指令选项的基础

4.2 常见环境变量

PATH : 指定命令的搜索路径
HOME : 指定用户的主工作目录(即用户登陆到Linux系统中时,默认的目录)
SHELL : 当前Shell,它的值通常是/bin/bash。

查看环境变量方法

echo $环境变量名
echo $PATH

4.3 测试PATH

创建hello.c文件

#include <stdio.h>
int main()
{
    printf("hello world!\n");
    return 0;
}

对比./hello和直接hello执行
为什么有些指令可以直接执行，不需要带路径，而我们的二进制程序需要带路径执行
将我们的程序所在路径加入环境变量PATH当中, export PATH=$PATH:hello程序所在路径

添加/删除指令到PATH环境变量中

sudo cp myprocess /usr/bin	-- 添加
sudo rm /usr/bin/myprocess	-- 删除
PATH = "路径":PATH

4.4 与环境变量相关的命令

echo: 显示某个环境变量值
export: 设置一个新的环境变量
env: 显示所有环境变量
unset: 清除环境变量
set: 显示本地定义的shell变量和环境变量

4.5 环境变量的组织方式

每个程序都会收到一张环境表，环境表是一个字符指针数组，每个指针指向一个以’\0’结尾的环境字符串

4.6 通过代码如何获取环境变量

引入命令行的第三个参数

#include <stdio.h>
int main(int argc, char *argv[], char *env[])
{
    for(int i = 0;; env[i]; i++)
    {
    	printf("%s\n", env[i]);
    }
    return 0;
}

通过第三方变量environ获取

#include <stdio.h>
int main(int argc, char *argv[])
{
    extern char **environ;
    for(int i = 0;; environ[i]; i++)
    {
    	printf("%s\n", environ[i]);
    }
    return 0;
}

libc中定义的全局变量environ指向环境变量表,environ没有包含在任何头文件中,所以在使用时要用extern声明

通过系统调用获取或设置环境变量

#include <stdio.h>
#include <stdlib.h>
int main()
{
    printf("%s\n", getenv("PATH"));
    return 0;
}

常用getenv和putenv函数来访问特定的环境变量。

五. 进程地址空间

5.1 程序地址空间

代码1：

int g_unval;
int g_val = 100;

int main(int argc, char* argv[], char* env[])
{
    printf("code addr:%p\n", main);// 代码位置
    printf("init data addr:%p\n", &g_val);//已初始化数据的地址
    printf("uninit data addr:%p\n", &g_unval);//未初始化数据的地址

    char* heap = (char*)malloc(20);
    char* heap1 = (char*)malloc(20);
    char* heap2 = (char*)malloc(20);
    char* heap3 = (char*)malloc(20);
    printf("heap addr:%p\n", heap);// 堆区的地址
    printf("heap1 addr:%p\n", heap1);
    printf("heap2 addr:%p\n", heap2);
    printf("heap3 addr:%p\n", heap3);

    static int c = 0;
    printf("stack addr:%p\n", &heap);// 栈区的地址 -- heap是一个指针变量，指针变量在栈区保存
    printf("stack1 addr:%p\n", &heap1);
    printf("stack2 addr:%p\n", &heap2);
    printf("stack3 addr:%p\n", &heap3);
    printf("c addr:%p, c: %d\n", &c, c);
    	
    return 0;
}

输出结果：

代码2：

int g_val = 100;
int main()
{
    pid_t id = fork();
    if(id == 0)
    {
        // 子进程
        while(1)
        {
            printf("child, pid: %d,\t ppid: %d,\t g_val: %d,\t &g_val: %p\t\n", getpid(), getppid(),g_val, &g_val);
            sleep(1);
        }
    }
    else
    {
        // 父进程
        while(1)
        {
            printf("father, pid: %d,\t ppid: %d,\t g_val: %d,\t &g_val: %p\t\n", getpid(), getppid(),g_val, &g_val);
            sleep(1);
        }
    }
    return 0;
}

输出结果：

我们发现，输出出来的变量值和地址是一模一样的，很好理解呀，因为子进程按照父进程为模版，父子并没有对变
量进行进行任何修改。可是将代码稍加改动:

int g_val = 100;
int main()
{
    pid_t id = fork();
    if(id == 0)
    {
        // 子进程
        int cnt = 0;
        while(1)
        {
            printf("child, pid: %d,\t ppid: %d,\t g_val: %d,\t &g_val: %p\t\n", getpid(), getppid(),g_val, &g_val);
            sleep(1);
           	cnt++;
            // 当程序执行五秒之后，修改g_val的值,观察变化
           	if(cnt == 5)
           	{
           		g_val = 200;
                printf("child change g_val from 100 to 200\n");
           	}
        }
    }
    else
    {
        // 父进程
        while(1)
        {
            printf("father, pid: %d,\t ppid: %d,\t g_val: %d,\t &g_val: %p\t\n", getpid(), getppid(),g_val, &g_val);
            sleep(1);
        }
    }
    return 0;
}

输出结果：

我们发现，父子进程，输出地址是一致的，但是变量内容不一样！能得出如下结论:

变量内容不一样,所以父子进程输出的变量绝对不是同一个变量
但地址值是一样的，说明，该地址绝对不是物理地址！
在Linux地址下，这种地址叫做虚拟地址
我们在用C/C++语言所看到的地址，全部都是虚拟地址！物理地址，用户一概看不到，由OS统一管理

OS必须负责将虚拟地址转化成物理地址

5.2 进程地址空间

每个进程都会存在一个进程地址空间
进程地址空间在本质上事一种数据结构，具体到进程中就是特定数据结构的对象

struct 进程地址空间
{
    // 进程地址空间属性
    struct 进程地址空间 *next；
}

-- 在PCB中也有struct 进程地址空间的一直指针

所以之前说程序的地址空间是不准确的，准确的应该说成进程地址空间

分页&虚拟地址空间

上面的图就足矣说名问题，同一个变量，地址相同，其实是虚拟地址相同，内容不同其实是被映射到了
不同的物理地址！

我们的地址空间不具备对我们的代码和数据的保存能力，这些东西是在物理内存中保存的

系统将地址空间上的地址虚拟或线性的转化到物理内存中，给我们提供的一张映射表，即为页表

其他问题

为什么要有进程地址空间？

a. 进程管理与内存的相关管理，即将物理内存由无序变成有序，让进程能够以统一的视角看待内存

b. 让进程管理和内存管理进行解耦，互不干扰

c. 地址空间 + 页表是保护内存安全的重要手段

申请了内存，会直接使用吗？

不一定，操作系统，一定腰围效率和资源的使用负责

申请内存的本质是在哪里申请，

在进程的虚拟地址空间中申请，充分保证内存的使用率，不会空转，提升new或者malloc的速度

但地址值是一样的，说明，该地址绝对不是物理地址！

在Linux地址下，这种地址叫做虚拟地址
我们在用C/C++语言所看到的地址，全部都是虚拟地址！物理地址，用户一概看不到，由OS统一管理

OS必须负责将虚拟地址转化成物理地址

5.2 进程地址空间

每个进程都会存在一个进程地址空间
进程地址空间在本质上事一种数据结构，具体到进程中就是特定数据结构的对象

struct 进程地址空间
{
    // 进程地址空间属性
    struct 进程地址空间 *next；
}

-- 在PCB中也有struct 进程地址空间的一直指针

所以之前说程序的地址空间是不准确的，准确的应该说成进程地址空间

分页&虚拟地址空间

上面的图就足矣说名问题，同一个变量，地址相同，其实是虚拟地址相同，内容不同其实是被映射到了
不同的物理地址！

我们的地址空间不具备对我们的代码和数据的保存能力，这些东西是在物理内存中保存的

系统将地址空间上的地址虚拟或线性的转化到物理内存中，给我们提供的一张映射表，即为页表

其他问题

为什么要有进程地址空间？

a. 进程管理与内存的相关管理，即将物理内存由无序变成有序，让进程能够以统一的视角看待内存

b. 让进程管理和内存管理进行解耦，互不干扰

c. 地址空间 + 页表是保护内存安全的重要手段

申请了内存，会直接使用吗？

不一定，操作系统，一定腰围效率和资源的使用负责

申请内存的本质是在哪里申请，

在进程的虚拟地址空间中申请，充分保证内存的使用率，不会空转，提升new或者malloc的速度