服务器CGI模式的运行机制

CGI概括:

定义

通用网关接口(Common Gateway Interface)HTTP服务器与你的或其它机器上的程序进行交谈的一种工具,其程序须运行在网络服务器上。

功能

绝大多数的CGI程序被用来解释处理自表单的输入信息,并在服 
务器产生相应的处理,或将相应的信息反馈给浏览器。CGI程序使 
网页具有交互功能。 

运行环境

CGI程序在UNIX操作系统上CERNNCSA格式的服务器上运行。 
在其它操作系统(如:windows NTwindows95等)的服务器上 
也广泛地使用CGI程序,同时它也适用于各种类型机器。 

处理步骤

通过Internet把用户请求送到服务器。 
服务器接收用户请求并交给CGI程序处理。 
⑶CGI程序把处理结果传送给服务器。 
服务器把结果送回到用户。 

 

 

一、基本原理

CGI :通用网关接口(Common Gateway Interface)是一个Web服务器主机提供信息服务的标准接口。通过CGI接口,WEB服务器就能够获取客户端提交的信息,转交给服务器端的CGI程序进行处理,最后返回结果给客户端。

组成CGI通信系统的是两部分:一部分是html页面,另一部分是运行在服务器上的CGI程序。

它们之间的通讯方式如下图:

 

服务器与客户端之间的通信,是客户端的浏览器和服务器端的http服务器之间的HTTP通信,在这里只需要知道浏览器请求执行服务器上哪个CGI程序就行了;

服务器和CGI程序之间的通讯才是我们关注的。一般情况下,服务器和CGI程序之间是通过标准输入输出来进行数据传递的,而这个过程需要环境变量的协作方可实现。

1、服务器将URL指向一个应用程序

2、服务器为应用程序执行做准备

3、应用程序执行,读取标准输入和有关环境变量

4、应用程序进行标准输出

环境变量在CGI中有着重要的地位,每个CGI程序只能处理一个用户请求,所以在激活一个CGI程序进程时创建了属于该进程的环境变量。

二、环境变量

对于CGI程序来说,它继承了系统的环境变量,CGI变量在CGI程序启动时初始化,在结束时销毁。

当一个CGI程序不是被HTTP服务器调用时,它的环境变量几乎是系统环境变量的复制。当这个CGI程序被HTTP服务器调用时,它的环境变量就会多了以下关于HTTP服务器、客户端。CGI传输过程等项目。

 

 

与请求相关的环境变量:

REQUEST_METHOD(服务器与CGI程序之间的信息传输方式)

QUERY_STRING(采用GET时所传输的信息)

CONTNENT_LENGTH(STDIO中的有效信息长度)

CONTENT_TYPE(指示所传来的信息的MIME类型)

CONTENT_FILE(使用windows httpd/wincgi标准时,用来传送数据的文件名)

....等等

与服务器有关环境变量:

GATEWAY_INTERFACE(服务器所实现的CGI版本)

SERVER_NAME(服务器的IP或名字)

SERVER_PORT(主机的端口号)

SERVER_SOFTWARE(调用CGI程序的HTTP服务器的名称和版本号)

   与客户端相关的环境变量:

REMOTE_ADDR(客户机的主机名)

REMOTE_HOST(客户机的IP地址)

ACCEPT(列出客户机支持的编码方式)

ACCEPT_LANGUAGE(表明客户机可接受语言的ISO代码)

AUTORIZATION(表明被证实了的用户)

FROM(列出客户机的email地址)

IF_MODIFIED_SINGCE(当用get方式请求并且只有当文档比指定日期更早时才返回数据)

PRAGMA(设定将来要用到的服务器代理)

REFFERER(指定连接到当前文档的文档的URL)

USER AGENT(客户端浏览器的信息)

 

/**

*其实上面的变量在都可以在http报文的消息头里面找到

**/

CONTENT_TYPE:application/x-www-form-urlencoded,表示数据来自HTML表单,并且经过URL编码。

ACCEPT:客户机所支持的MIME类型清单,内容如:’image/gif,image/jpeg’

REQUEST_METHOD:一般包含POSTGET.

 

环境变量是一个保存用户信息的内存区。当客户端的用户通过浏览器发出CGI请求时,服务器就寻找本地的相应CGI程序并执行它。在执行CGI程序的同时,服务器把该用户的信息保存到环境变量里。接下来,CGI程序的执行流程是这样的:查询与该CGI程序进程相应的环境变量:第一步是request_method,如果是POST,就从环境变量的len,然后到该进程相应的标准输入取出len长的数据。如果是GET,则用户数据就在环境变量的QUERY_STRING.

三.CGI程序实现步骤:

1.从服务器上获取数据:

获取环境变量的时候,“如果先判断REQUEST_METHOD”是否存在,程序会更健壮,否则在某些情况下可能会造成程序崩溃。因为假若CGI程序不是由服务器调用的,那么环境变量集里就没有与CGI相关的环境变量(如REQUEST_METHODREMOTE_ADDR等)添加“进来,也就是说getenv(REQUEST_METHOD)”将返回NULL

 

2.URL编码:

不管是POST还是GET方式,客户端浏览器发送给服务器的数据都不是原始的用户数据,而是经过URL编码的。此时,CGI的环境变量Content_type将被设置,如Content_type = application/x-www-form-urlencode就表示服务器收到的是经过URL编码的包含有HTML表单变量数据。

编码的基本规则是:变量之间用“&”分开;

“变量与其对应值用=”连接;“空格用+”代替;

“保留的控制字符则用%”连接对应的16禁止ASCII码代替;

“某些具有特殊意义的字符也用%”接对应的16进制ASCII码代替;空格是非法字符;

任意不可打印的ASCII控制字符均为非法字符。

 

3.CGI数据输出:

CGI程序如何将信息处理结果返回给客户端?这实际上是CGI格式化输出。 在CGI程序中的标准输出stdout是经过重定义了的,它并没有在服务器上产生任何的输出内容,而是被重定向到客户浏览器,这与它是由C,还是PerlPython实现无关。 所以,我们可以用打印来实现客户端新的HTML页面的生成。比如,Cprintf是向该进程的标准输出发送数据,PerlPythonprint向该进程的标准输出发送数据。

(1CGI标题

CGI的格式输出内容必须组织成标题/内容的形式。CGI标准规定了CGI程序可以使用的三个HTTP标题。标题必须占据第一行输出!而且必须随后带有一个空行。

标题描述:

Content_type   (内容类型)设定随后输出数据所用的MIME类型

Location    (地址)设定输出为另外一个文档(URLStatus      (状态)指定HTTP状态码MIME

向标准输出发送网页内容时要遵守MIME格式规则:

任意输出前面必须有一个用于定义MIME类型的输出内容(Content-type)行,而且随后还必须跟一个空行。如果遗漏了这一条,服务将会返回一个错误信息。(同样使用于其他标题)

 

 

例如PerlPython

print Content-type:text/html\n\n;   //输出HTML格式的数据

print <body>welcome<br>

print </body>

C语言:

printf( Content-type:text/html\n\n);

printf(Welcome\n);

 

 

MIME类型以类型/子类型(type/subtype)的形式表示。

其中type表示一下几种典型文件格式的一种:

TextAudioVideoImageApplicationMutipartMessage

Subtype则用来描述具体所用的数据格式。

Application/msword微软的Word文件

Application/octet-stream一种通用的二进制文件格式

Application/zipZip压缩文件

Application/pdfPdf文件

。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

Location

使用Location标题,一个CGI可以使当前用户转而访问同一服务器上的另外一个程序,甚至可以访问另外一个URL,但服务器对他们的处理方式不一样。

使用Location的格式为:LocationFilename/URL

 

例如:print Location:/test.html\n\n;

这与直接链接到test.html的效果是一样的。

 

print Location:http://www.chinaunix.com/\n\n

由于该URL并不指向当前服务器,用户浏览器并不会直接链接到指定的URL,而是给用户输出提示信息。

 

HTTP状态码:

表示了请求的结果状态,是CGI程序通过服务器用来通知用户其请求是否成功执行的信息码,本文不做研究。

 

四、CGI中的信号量和文件锁 

因为CGI程序时公用的,而WEB服务器都支持多进程运行,因此可能会发生同时有多个用户访问同一个CGI程序的情况。比如,有2个用户几乎同时访问同一个CGI程序,服务器为他们创建了2CGI程序进程,设为进程A和进程B。假如进程A首先打开了某个文件,然后由于某种原因被挂起(一般是由于操作系统的进程调度);而就在进程A被挂起的这段时间内,进程B完成了对文件的整个操作流程:打开,写入,关闭;进程A再继续往下执行,但进程A所操作的文件依旧是原来文件的就版本,此时进程A的操作结果将覆盖进程B的操作结果。 

为了防止这种情况发生,需要用到文件锁或者信号量。

钥匙文件?假如有多个不同的HTML可以调用同一个CGI程序,那么CGI程序如何区分它们呢?一个是通过隐含的INPUT标签。不过觉得这个比较麻烦,因为CGI必须经过一系列解码后才能找到这个隐含INPUT的变量和其值。

 

五.设置HTTP服务器以兼容CGI

Perl编写的CGI程序后缀为:.plPython编写的CGI程序后缀为:.py;而C编写的CGI程序后缀为:.cgi,如果在win下编译出来的是.exe,最好将它重命名为.cgi。这些都是为了HTTP服务能够识别并调用它们。

当使用appche httpd服务器时,请编辑它的配置文件httpd.conf如下:修改AddHandler cgi-script一句为AddHandler cgi-script .cgi .py .pl

 

 

 

 

 

 

  • 3
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值