环境变量

环境变量 

分类: LINUX

进程存储空间的布局

低地址 → 高地址
正文区 初始化数据区 非初始化数据区 堆→ | 虚地址空间 | ←栈 命令行参数和环境变量
   
    在unix/linux系统中,当产生一个新进程时,内核要为进程分配存储空间(如上图)并且进行初始化操作
过程大致如下
        内核
       invoke
        fork() // 产生一个新进程,分配存储空间
       invoke
       exec("可执行程序的路径", ......)   // 有6个不同的exec函数,初始进程环境,调用main函数
        {
               .............
               读取程序指令到正文区
               读取初始化数据,在文件中获取它的值
               非初始化数据赋初值为0 或 NULL
               .............
               启动一个特殊例程从内核加载命令行参数环境变量
               exit(main(arc, argv));   // main函数被调用,程序正式开始执行
        }
   
    环境变量是操作系统传递给进程的一组字符串信息(如:PATH等)。它存放在存储空间的高地址区域(见布局)----命令行参数和环境变量,它们都是一组字符串。命令行参数列表由char**argv指向,字符串个数由int argc指明,他们正是main函数的两个参数。环境变量和命令行参数类似,但它是一个全局变量char**environ,它指向环境表(环境字符串的集合)并以NULL空串结尾,所以它不需要argc这样的变量来指明环境字符串的个数。
    这块区域的初始化是由exec函数中的特殊例程(见过程)完成,内核会根据字符串数来确定它的大小,所以这片区域的大小是固定的,这样做有一定的道理,因为命令行参数是不允许修改的。然而环境变量并没有这个限制,可以修改,删除,添加环境字符串,这就会导致空间不够
,采用的做法是向堆扩充 。当添加一个新的环境字符串时,不但要在堆中申请一片空间存放字符串,而且要把整张环境表移到堆中,因为新字符串的指针要添加进环境表,所以这样操作起来会很麻烦(详细分析参见----《unix环境高级编程(第二版)》第七章进程环境)。为什么不直接把环境变量安排在堆中,而是和命令行参数安排在同一区域呢?这样的设计很让人困惑,难道只是因为两者的相同点?

正如我们前面提到的那样,环境字符串(environment strings)通常是这样的格式:
name=value
UNIXkernel从来都不理会(lookat)这些字符串;它们的解释(interdivtation)是由各种各样的应用程序来做的。比如shell就使用了许多环境变量。一些环境变量是在登录的时候就自动地被设置了,比如HOME和USER,而其它的(事实上是否是所有的?)则可以由我们自己来设置。我们通常在一个shell启动文件(ashell start-upfile)里来设置这些环境变量以便控制shell的行为(actions)。比如,如果我们设置了环境变量MAILPATH,就告诉了theBourne shell, GNU Bourne-again shell和Korn shell到哪里去查找mail。

ISOC定义了一个函数getenv,通过使用这个函数,我们可以从环境里取value,but this standard says that thecontents of the environment are implementation defined.

注意:这个函数返回一个指针,指向一个name=value字符串的value。我们应该坚持用getenv来从环境中取得一个特定的value,而不是直接使用环境指针environ。(why?)

一些环境变量由POSIX.1在某个特定的UNIX实现里定义(defined by POSIX.1 in the Single UNIXSpecification),然而其它的只有在支持XSI扩展(XSIextensions)的UNIX实现里才被定义。图7.7列出了在一些特定UNIX实现里定义的环境变量,请注意每一种变量由哪种实现支持。图中由POSIX.1定义的环境变量由黑点标记;否则就是属于XSI扩展的。许多其他的依赖于实现的环境变量(implementation-dependent environment variables)也在图中所示的四种实现中使用。注意:ISOC没有定义任何环境变量。(都是POSIX.1和XSI扩展定义的)

除了取一个环境变量的值,有时候我们也想设置一个环境变量(改变其原有值或者定义一个新的环境变量)。我们可能想改变一个已经存在的环境变量的值或者添加一个新的环境变量到环境中。(在下一章中,我们将看到我们能够只能在当前进程及其任一个子进程中affect环境)不幸的是,不是所有的系统都支持这个capability。


clearenv不属于一个特定UNIX实现的一部分。它用来从环境列表(environment list)中删除所有的元素。(环境列表是一个数组)

这3个函数的操作如下所述:
* putenv takes a sting of form name=value并且将该字符串加入到环境列表数组中。如果name已经存在,它原来的value将被替换。

* setenv设置一个环境变量name的value(该函数的前2个参数)。如果环境变量name在环境中已经存在,那么根据第3个参数rewrite来进行接下来的操作(a)如果rewrite非0,那么

name原来的值被替换;(b)如果rewrite为0,那么保持name原来的值并且不报错。

* unsetenv删除由参数name指定的环境变量的定义。如果指定的环境变量不存在也不报错。

注意:putenv和setenv的差别。setenv必须先分配一块内存用来创建字符串name=value(根据其前2个参数),而putenv直接将传给它的参数str加入到环境中。事实上,在Linux和Solaris中,putenv的实现是将传给它的str的地址加入到环境变量数组中(该数组的元素是指针)。在这种情况下,传给putenv一个存储在栈中的字符串将会是一个错误,因为栈是会被重用的(当从当前函数返回后,指针指向的内存内容可能已经改变了)。

检查一下这些函数如何修改环境列表是有趣的。回忆一下图7.6:环境列表数组中的指针指向实际的name=value字符串,并且这些字符串是存储在一个进程内存空间的顶部的,在栈之上。删除一个name=value字符串是简单的;我们只要在环境列表数组中找到那个指针然后将后续的指针向下移动一位即可。但是添加一个新的字符串或者修改一个已经存在的字符串要困难点。在栈之上的内存空间是不能扩展的,因为这里通常是一个进程的内存空间的最顶部分,所以我们不能向上再扩展了;也不能向下扩展,因为也不能移动下面的栈段。

1.如果我们要修改一个已经存在的字符串(modifying an existing name):
 a.如果新的值的size小于等于已经存在的值,我们可以直接通过拷贝覆盖原来的字符串
 b.但是如果新的值的size大于已经存在的值,我们必须通过malloc来获得新的空间来存储新的字符串,将新的字符串拷贝到 这个新空间,然后改变环境列表中的原指针,使其指向存储着新字符串的这块新获得的空间。

2.如果我们要添加一个新的name(adding a new name),会更加复杂。首先我们必须调用malloc来为新的name=value字符串分配空间,然后将该字符串拷贝进去。
 a.然后,如果这是我们第一次添加一个新的name,我们必须调用malloc来获得一个空间(建立一个新的环境列表),用来存储一个新的环境列表。我们将旧的环境列表数组拷贝到这个空间,再在新的列表的末尾存上指向新的name=value字符串的指针。当然在新的环境列表的末尾,我们也存储一个空指针。最后,我们设置环境指针environ,使其指向这个新的环境列表。从图7.6可以注意到,如果旧的环境列表在栈之上(栈之上的是环境变量和命令行参数,而环境列表这个数组并不一定于环境变量一起存在栈之上),那么我们已经将其移到堆上了(malloc在堆上分配内存)。但是新的环境列表中的大部分指针仍然是指向在栈之上的那些name=value字符串的。

 b.如果这不是我们第一次添加一个新的字符串到环境列表中,那么我们就知道了,我们已经在堆上新建了一个环境列表,所以我们只需要调用realloc来为一个新指针分配空间。这个指向新的name=value字符串的指针存储到环境列表的末尾(在原来的空指针之上),后面仍是跟着一个空指针。


1.2.1. 如何从程序中获得/设置环境变量?

获得一个环境变量可以通过调用‘getenv()’函数完成。

     #include <stdlib.h>

     char *getenv(const char *name);
      

设置一个环境变量可以通过调用‘putenv()’函数完成。

     #include <stdlib.h>

     int putenv(char *string);
      

变量string应该遵守"name=value"的格式。已经传递给putenv函数的字符串*不*能够被释放或变成无效,因为一个指向它的指针将由‘putenv()’保存。这意味着它必须是在静态数据区中或是从堆(heap)分配的。如果这个环境变量被另一个‘putenv()’的调用重新定义或删除,上述字符串可以被释放。

/**************************译者增加***********************************

因为putenv()有这样的局限,在使用中经常会导致一些错误,GNU libc 中还包括了两个BSD风格的函数:

#include <stdlib.h>

int setenv(const char *name, const char *value, int replace);
void unsetenv(const char *name);
      

setenv()/unsetenv()函数可以完成所有putenv()能做的事。setenv() 可以不受指针限制地向环境变量中添加新值,但传入参数不能为空(NULL)。当replace为0时,如果环境变量中已经有了name项,函数什么也不做(保留原项),否则原项被覆盖。unsetenv()是用来把name项从环境变量中删除。注意:这两个函数只存在在BSD和GNU库中,其他如SunOS系统中不包括它们,因此将会带来一些兼容问题。我们可以用getenv()/putenv()来实现:

int setenv(const char *name,  const char *value, int replace)
{
   char *envstr;

   if (name == NULL || value == NULL)
      return 1;
   if (getenv(name) !=NULL)
     {
        envstr = (char *) malloc(strlen(name) + strlen(value) + 2);
        sprintf (envstr, "%s=%s", name, value);
        if (putenv(envstr));
           return 1;
     }
   return 0;
} 
      

**************************译者增加***********************************/

记住环境变量是被继承的;每一个进程有一个不同的环境变量表拷贝(译者注:从core文件中我们可以看出这一点)。结果是,你不能从一个其他进程改变当前进程的环境变量,比如shell进程。

假设你想得到环境变量‘TERM’的值,你需要使用下面的程序:

     char *envvar;

     envvar=getenv("TERM");

     printf("The value for the environment variable TERM is ");
     if(envvar)
     {
         printf("%s\n",envvar);
     }
     else
     {
         printf("not set.\n");
     }
      

现在假设你想创建一个新的环境变量,变量名为‘MYVAR’,值为‘MYVAL’。以下是你将怎样做:

     static char envbuf[256];

     sprintf(envbuf,"MYVAR=%s","MYVAL");

     if(putenv(envbuf))
     {
         printf("Sorry, putenv() couldn't find the memory for %s\n",envbuf);
         /* Might exit() or something here if you can't live without it */
     }
      

1.2.2. 我怎样读取整个环境变量表?

如果你不知道确切你想要的环境变量的名字,那么‘getenv()’函数不是很有用。在这种情况下,你必须更深入了解环境变量表的存储方式。

全局变量,‘char **envrion’,包含指向环境字符串指针数组的指针,每一个字符串的形式为‘“NAME=value”’(译者注:和putenv()中的“string”的格式相同)。这个数组以一个‘空’(NULL)指针标记结束。这里是一个打印当前环境变量列表的小程序(类似‘printenv’)。

     #include <stdio.h>

     extern char **environ;

     int main()
     {
         char **ep = environ;
         char *p;
         while ((p = *ep++))
             printf("%s\n", p);
         return 0;
     }
      

一般情况下,‘envrion’变量作为可选的第三个参数传递给‘main()’;就是说,上面的程序可以写成:

     #include <stdio.h>

     int main(int argc, char **argv, char **envp)
     {
         char *p;
         while ((p = *envp++))
             printf("%s\n", p);
         return 0;
     }
      

虽然这种方法被广泛的操纵系统所支持(译者注:包括DOS),这种方法事实上并没有被POSIX(译者注:POSIX: Portable Operating System Interace)标准所定义。(一般的,它也比较没用)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值