进程的基本概念(下)-- 环境变量与进程地址空间

进程的概念

四. 环境变量

4.1 基本概念

  • 环境变量(environment variables)一般是指在操作系统中用来指定操作系统运行环境的一些参数
  • 如:我们在编写C/C++代码的时候,在链接的时候,从来不知道我们的所链接的动态静态库在哪里,但
    是照样可以链接成功,生成可执行程序,原因就是有相关环境变量帮助编译器进行查找。
  • 环境变量通常具有某些特殊用途,还有在系统当中通常具有全局特性
  • 环境变量不是一个,而是一堆,彼此其实没有关系,一般是系统内置的具有特殊用途的变量
  • 环境变量具有全局属性,会被所有的子进程包括孙子进程继承

什么是变量?

定义变量的本质其实是开辟空间,在运行期间我们也可以开辟空间

操作系统/bash是用C语言写的程序,在它运行的过程中也可以开辟空间定义变量吗?

可以;系统的环境变量本质就是系统自己开辟空间,放入内容。

main参数 – 命令行参数

我们可以通过不同的选项来执行程序内部不同的代码功能

image-20240303122618648

命令行参数,是Linux指令选项的基础

4.2 常见环境变量

PATH : 指定命令的搜索路径
HOME : 指定用户的主工作目录(即用户登陆到Linux系统中时,默认的目录)
SHELL : 当前Shell,它的值通常是/bin/bash。

查看环境变量方法

echo $环境变量名
echo $PATH

4.3 测试PATH

  1. 创建hello.c文件
#include <stdio.h>
int main()
{
    printf("hello world!\n");
    return 0;
}
  1. 对比./hello和直接hello执行
  2. 为什么有些指令可以直接执行,不需要带路径,而我们的二进制程序需要带路径执行
  3. 将我们的程序所在路径加入环境变量PATH当中, export PATH=$PATH:hello程序所在路径

添加/删除指令到PATH环境变量中

sudo cp myprocess /usr/bin	-- 添加
sudo rm /usr/bin/myprocess	-- 删除
PATH = "路径":PATH

4.4 与环境变量相关的命令

  1. echo: 显示某个环境变量值
  2. export: 设置一个新的环境变量
  3. env: 显示所有环境变量
  4. unset: 清除环境变量
  5. set: 显示本地定义的shell变量和环境变量

4.5 环境变量的组织方式

image-20240303124059537

每个程序都会收到一张环境表,环境表是一个字符指针数组,每个指针指向一个以’\0’结尾的环境字符串

4.6 通过代码如何获取环境变量

  • 引入命令行的第三个参数
#include <stdio.h>
int main(int argc, char *argv[], char *env[])
{
    for(int i = 0;; env[i]; i++)
    {
    	printf("%s\n", env[i]);
    }
    return 0;
}
  • 通过第三方变量environ获取
#include <stdio.h>
int main(int argc, char *argv[])
{
    extern char **environ;
    for(int i = 0;; environ[i]; i++)
    {
    	printf("%s\n", environ[i]);
    }
    return 0;
}

libc中定义的全局变量environ指向环境变量表,environ没有包含在任何头文件中,所以在使用时 要用extern声明

通过系统调用获取或设置环境变量

#include <stdio.h>
#include <stdlib.h>
int main()
{
    printf("%s\n", getenv("PATH"));
    return 0;
}

常用getenv和putenv函数来访问特定的环境变量。

五. 进程地址空间

5.1 程序地址空间

image-20240303124811691

代码1:

int g_unval;
int g_val = 100;

int main(int argc, char* argv[], char* env[])
{
    printf("code addr:%p\n", main);// 代码位置
    printf("init data addr:%p\n", &g_val);//已初始化数据的地址
    printf("uninit data addr:%p\n", &g_unval);//未初始化数据的地址

    char* heap = (char*)malloc(20);
    char* heap1 = (char*)malloc(20);
    char* heap2 = (char*)malloc(20);
    char* heap3 = (char*)malloc(20);
    printf("heap addr:%p\n", heap);// 堆区的地址
    printf("heap1 addr:%p\n", heap1);
    printf("heap2 addr:%p\n", heap2);
    printf("heap3 addr:%p\n", heap3);

    static int c = 0;
    printf("stack addr:%p\n", &heap);// 栈区的地址 -- heap是一个指针变量,指针变量在栈区保存
    printf("stack1 addr:%p\n", &heap1);
    printf("stack2 addr:%p\n", &heap2);
    printf("stack3 addr:%p\n", &heap3);
    printf("c addr:%p, c: %d\n", &c, c);
    	
    return 0;
}

输出结果:

image-20240303125022495

代码2:

int g_val = 100;
int main()
{
    pid_t id = fork();
    if(id == 0)
    {
        // 子进程
        while(1)
        {
            printf("child, pid: %d,\t ppid: %d,\t g_val: %d,\t &g_val: %p\t\n", getpid(), getppid(),g_val, &g_val);
            sleep(1);
        }
    }
    else
    {
        // 父进程
        while(1)
        {
            printf("father, pid: %d,\t ppid: %d,\t g_val: %d,\t &g_val: %p\t\n", getpid(), getppid(),g_val, &g_val);
            sleep(1);
        }
    }
    return 0;
}

输出结果:

image-20240303125639746

我们发现,输出出来的变量值和地址是一模一样的,很好理解呀,因为子进程按照父进程为模版,父子并没有对变
量进行进行任何修改。可是将代码稍加改动:

int g_val = 100;
int main()
{
    pid_t id = fork();
    if(id == 0)
    {
        // 子进程
        int cnt = 0;
        while(1)
        {
            printf("child, pid: %d,\t ppid: %d,\t g_val: %d,\t &g_val: %p\t\n", getpid(), getppid(),g_val, &g_val);
            sleep(1);
           	cnt++;
            // 当程序执行五秒之后,修改g_val的值,观察变化
           	if(cnt == 5)
           	{
           		g_val = 200;
                printf("child change g_val from 100 to 200\n");
           	}
        }
    }
    else
    {
        // 父进程
        while(1)
        {
            printf("father, pid: %d,\t ppid: %d,\t g_val: %d,\t &g_val: %p\t\n", getpid(), getppid(),g_val, &g_val);
            sleep(1);
        }
    }
    return 0;
}

输出结果:

image-20240303130049335

我们发现,父子进程,输出地址是一致的,但是变量内容不一样!能得出如下结论:

  • 变量内容不一样,所以父子进程输出的变量绝对不是同一个变量
  • 但地址值是一样的,说明,该地址绝对不是物理地址!
  • 在Linux地址下,这种地址叫做 虚拟地址
  • 我们在用C/C++语言所看到的地址,全部都是虚拟地址!物理地址,用户一概看不到,由OS统一管理

OS必须负责将 虚拟地址 转化成 物理地址

5.2 进程地址空间

  • 每个进程都会存在一个进程地址空间
  • 进程地址空间在本质上事一种数据结构,具体到进程中就是特定数据结构的对象
struct 进程地址空间
{
    // 进程地址空间属性
    struct 进程地址空间 *next;
}

-- 在PCB中也有struct 进程地址空间的一直指针

image-20240303130739885

所以之前说程序的地址空间是不准确的,准确的应该说成 进程地址空间

image-20240303130304383

分页&虚拟地址空间

上面的图就足矣说名问题,同一个变量,地址相同,其实是虚拟地址相同,内容不同其实是被映射到了
不同的物理地址!

我们的地址空间不具备对我们的代码和数据的保存能力,这些东西是在物理内存中保存的

系统将地址空间上的地址虚拟或线性的转化到物理内存中, 给我们提供的一张映射表,即为页表

其他问题

  1. 为什么要有进程地址空间?

    a. 进程管理与内存的相关管理, 即将物理内存由无序变成有序,让进程能够以统一的视角看待内存

    b. 让进程管理和内存管理进行解耦,互不干扰

    c. 地址空间 + 页表 是保护内存安全的重要手段

  2. 申请了内存,会直接使用吗?

    不一定,操作系统,一定腰围效率和资源的使用负责

  3. 申请内存的本质是在哪里申请,

    在进程的虚拟地址空间中申请,充分保证内存的使用率,不会空转,提升new或者malloc的速度

  • 但地址值是一样的,说明,该地址绝对不是物理地址!
  • 在Linux地址下,这种地址叫做 虚拟地址
  • 我们在用C/C++语言所看到的地址,全部都是虚拟地址!物理地址,用户一概看不到,由OS统一管理

OS必须负责将 虚拟地址 转化成 物理地址

5.2 进程地址空间

  • 每个进程都会存在一个进程地址空间
  • 进程地址空间在本质上事一种数据结构,具体到进程中就是特定数据结构的对象
struct 进程地址空间
{
    // 进程地址空间属性
    struct 进程地址空间 *next;
}

-- 在PCB中也有struct 进程地址空间的一直指针

image-20240303130739885

所以之前说程序的地址空间是不准确的,准确的应该说成 进程地址空间

image-20240303130304383

分页&虚拟地址空间

上面的图就足矣说名问题,同一个变量,地址相同,其实是虚拟地址相同,内容不同其实是被映射到了
不同的物理地址!

我们的地址空间不具备对我们的代码和数据的保存能力,这些东西是在物理内存中保存的

系统将地址空间上的地址虚拟或线性的转化到物理内存中, 给我们提供的一张映射表,即为页表

其他问题

  1. 为什么要有进程地址空间?

    a. 进程管理与内存的相关管理, 即将物理内存由无序变成有序,让进程能够以统一的视角看待内存

    b. 让进程管理和内存管理进行解耦,互不干扰

    c. 地址空间 + 页表 是保护内存安全的重要手段

  2. 申请了内存,会直接使用吗?

    不一定,操作系统,一定腰围效率和资源的使用负责

  3. 申请内存的本质是在哪里申请,

    在进程的虚拟地址空间中申请,充分保证内存的使用率,不会空转,提升new或者malloc的速度

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

是小张a_3168

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值