进程的概念
文章目录
四. 环境变量
4.1 基本概念
- 环境变量(environment variables)一般是指在操作系统中用来指定操作系统运行环境的一些参数
- 如:我们在编写C/C++代码的时候,在链接的时候,从来不知道我们的所链接的动态静态库在哪里,但
是照样可以链接成功,生成可执行程序,原因就是有相关环境变量帮助编译器进行查找。- 环境变量通常具有某些特殊用途,还有在系统当中通常具有全局特性
- 环境变量不是一个,而是一堆,彼此其实没有关系,一般是系统内置的具有特殊用途的变量
- 环境变量具有全局属性,会被所有的子进程包括孙子进程继承
什么是变量?
定义变量的本质其实是开辟空间,在运行期间我们也可以开辟空间
操作系统/bash是用C语言写的程序,在它运行的过程中也可以开辟空间定义变量吗?
可以;系统的环境变量本质就是系统自己开辟空间,放入内容。
main参数 – 命令行参数
我们可以通过不同的选项来执行程序内部不同的代码功能
命令行参数,是Linux指令选项的基础
4.2 常见环境变量
PATH : 指定命令的搜索路径
HOME : 指定用户的主工作目录(即用户登陆到Linux系统中时,默认的目录)
SHELL : 当前Shell,它的值通常是/bin/bash。
查看环境变量方法
echo $环境变量名
echo $PATH
4.3 测试PATH
- 创建hello.c文件
#include <stdio.h>
int main()
{
printf("hello world!\n");
return 0;
}
- 对比./hello和直接hello执行
- 为什么有些指令可以直接执行,不需要带路径,而我们的二进制程序需要带路径执行
- 将我们的程序所在路径加入环境变量PATH当中, export PATH=$PATH:hello程序所在路径
添加/删除指令到PATH环境变量中
sudo cp myprocess /usr/bin -- 添加
sudo rm /usr/bin/myprocess -- 删除
PATH = "路径":PATH
4.4 与环境变量相关的命令
- echo: 显示某个环境变量值
- export: 设置一个新的环境变量
- env: 显示所有环境变量
- unset: 清除环境变量
- set: 显示本地定义的shell变量和环境变量
4.5 环境变量的组织方式
每个程序都会收到一张环境表,环境表是一个字符指针数组,每个指针指向一个以’\0’结尾的环境字符串
4.6 通过代码如何获取环境变量
- 引入命令行的第三个参数
#include <stdio.h>
int main(int argc, char *argv[], char *env[])
{
for(int i = 0;; env[i]; i++)
{
printf("%s\n", env[i]);
}
return 0;
}
- 通过第三方变量environ获取
#include <stdio.h>
int main(int argc, char *argv[])
{
extern char **environ;
for(int i = 0;; environ[i]; i++)
{
printf("%s\n", environ[i]);
}
return 0;
}
libc中定义的全局变量environ指向环境变量表,environ没有包含在任何头文件中,所以在使用时 要用extern声明
通过系统调用获取或设置环境变量
#include <stdio.h>
#include <stdlib.h>
int main()
{
printf("%s\n", getenv("PATH"));
return 0;
}
常用getenv和putenv函数来访问特定的环境变量。
五. 进程地址空间
5.1 程序地址空间
代码1:
int g_unval;
int g_val = 100;
int main(int argc, char* argv[], char* env[])
{
printf("code addr:%p\n", main);// 代码位置
printf("init data addr:%p\n", &g_val);//已初始化数据的地址
printf("uninit data addr:%p\n", &g_unval);//未初始化数据的地址
char* heap = (char*)malloc(20);
char* heap1 = (char*)malloc(20);
char* heap2 = (char*)malloc(20);
char* heap3 = (char*)malloc(20);
printf("heap addr:%p\n", heap);// 堆区的地址
printf("heap1 addr:%p\n", heap1);
printf("heap2 addr:%p\n", heap2);
printf("heap3 addr:%p\n", heap3);
static int c = 0;
printf("stack addr:%p\n", &heap);// 栈区的地址 -- heap是一个指针变量,指针变量在栈区保存
printf("stack1 addr:%p\n", &heap1);
printf("stack2 addr:%p\n", &heap2);
printf("stack3 addr:%p\n", &heap3);
printf("c addr:%p, c: %d\n", &c, c);
return 0;
}
输出结果:
代码2:
int g_val = 100;
int main()
{
pid_t id = fork();
if(id == 0)
{
// 子进程
while(1)
{
printf("child, pid: %d,\t ppid: %d,\t g_val: %d,\t &g_val: %p\t\n", getpid(), getppid(),g_val, &g_val);
sleep(1);
}
}
else
{
// 父进程
while(1)
{
printf("father, pid: %d,\t ppid: %d,\t g_val: %d,\t &g_val: %p\t\n", getpid(), getppid(),g_val, &g_val);
sleep(1);
}
}
return 0;
}
输出结果:
我们发现,输出出来的变量值和地址是一模一样的,很好理解呀,因为子进程按照父进程为模版,父子并没有对变
量进行进行任何修改。可是将代码稍加改动:
int g_val = 100;
int main()
{
pid_t id = fork();
if(id == 0)
{
// 子进程
int cnt = 0;
while(1)
{
printf("child, pid: %d,\t ppid: %d,\t g_val: %d,\t &g_val: %p\t\n", getpid(), getppid(),g_val, &g_val);
sleep(1);
cnt++;
// 当程序执行五秒之后,修改g_val的值,观察变化
if(cnt == 5)
{
g_val = 200;
printf("child change g_val from 100 to 200\n");
}
}
}
else
{
// 父进程
while(1)
{
printf("father, pid: %d,\t ppid: %d,\t g_val: %d,\t &g_val: %p\t\n", getpid(), getppid(),g_val, &g_val);
sleep(1);
}
}
return 0;
}
输出结果:
我们发现,父子进程,输出地址是一致的,但是变量内容不一样!能得出如下结论:
- 变量内容不一样,所以父子进程输出的变量绝对不是同一个变量
- 但地址值是一样的,说明,该地址绝对不是物理地址!
- 在Linux地址下,这种地址叫做 虚拟地址
- 我们在用C/C++语言所看到的地址,全部都是虚拟地址!物理地址,用户一概看不到,由OS统一管理
OS必须负责将 虚拟地址 转化成 物理地址
5.2 进程地址空间
- 每个进程都会存在一个进程地址空间
- 进程地址空间在本质上事一种数据结构,具体到进程中就是特定数据结构的对象
struct 进程地址空间
{
// 进程地址空间属性
struct 进程地址空间 *next;
}
-- 在PCB中也有struct 进程地址空间的一直指针
所以之前说程序的地址空间
是不准确的,准确的应该说成 进程地址空间
分页&虚拟地址空间
上面的图就足矣说名问题,同一个变量,地址相同,其实是虚拟地址相同,内容不同其实是被映射到了
不同的物理地址!我们的地址空间不具备对我们的代码和数据的保存能力,这些东西是在物理内存中保存的
系统将地址空间上的地址虚拟或线性的转化到物理内存中, 给我们提供的一张映射表,即为页表
其他问题
为什么要有进程地址空间?
a. 进程管理与内存的相关管理, 即将物理内存由无序变成有序,让进程能够以统一的视角看待内存
b. 让进程管理和内存管理进行解耦,互不干扰
c. 地址空间 + 页表 是保护内存安全的重要手段
申请了内存,会直接使用吗?
不一定,操作系统,一定腰围效率和资源的使用负责
申请内存的本质是在哪里申请,
在进程的虚拟地址空间中申请,充分保证内存的使用率,不会空转,提升new或者malloc的速度
- 但地址值是一样的,说明,该地址绝对不是物理地址!
- 在Linux地址下,这种地址叫做 虚拟地址
- 我们在用C/C++语言所看到的地址,全部都是虚拟地址!物理地址,用户一概看不到,由OS统一管理
OS必须负责将 虚拟地址 转化成 物理地址
5.2 进程地址空间
- 每个进程都会存在一个进程地址空间
- 进程地址空间在本质上事一种数据结构,具体到进程中就是特定数据结构的对象
struct 进程地址空间
{
// 进程地址空间属性
struct 进程地址空间 *next;
}
-- 在PCB中也有struct 进程地址空间的一直指针
所以之前说程序的地址空间
是不准确的,准确的应该说成 进程地址空间
分页&虚拟地址空间
上面的图就足矣说名问题,同一个变量,地址相同,其实是虚拟地址相同,内容不同其实是被映射到了
不同的物理地址!我们的地址空间不具备对我们的代码和数据的保存能力,这些东西是在物理内存中保存的
系统将地址空间上的地址虚拟或线性的转化到物理内存中, 给我们提供的一张映射表,即为页表
其他问题
为什么要有进程地址空间?
a. 进程管理与内存的相关管理, 即将物理内存由无序变成有序,让进程能够以统一的视角看待内存
b. 让进程管理和内存管理进行解耦,互不干扰
c. 地址空间 + 页表 是保护内存安全的重要手段
申请了内存,会直接使用吗?
不一定,操作系统,一定腰围效率和资源的使用负责
申请内存的本质是在哪里申请,
在进程的虚拟地址空间中申请,充分保证内存的使用率,不会空转,提升new或者malloc的速度