CGI协议及其开发

作为Internet上最主要的信息管理和组织手段,WWW由一系列相应的技术及应用构 成,其组成技术包括HTTP、HTML、URL以及CGI等。WWW服务器本身提供一些基本功 能,以完成客户端的请求和自身的管理。但不同的用户有不同的功能要求,其中许 多功能是WWW服务器本身 不能提供的(比如在线查询等),它必须提供一种扩展手 段,以允许用户编写扩展应用程序来扩展服务器的功能。CGI(CommonGatewayInterface, 即通用网关接口)就是这样的一种标准扩展技术。下面就CGI的基本技术及其开发 进行讨论。 
一、CGI技术 
1.1CGI的提出 
CGI是外部扩展应用程序与WWW服务器交互的一个标准接口。按照CGI标准编写的外 部扩展应用程序可以处理客户端(一般是WWW浏览器)输入的协同工作数据,完成 客户端与服务器的交互操作。这在实际应用中非常有用,如可以编写CGI外部扩展 程序来访问外部数据库,客户端用户可以通过它和WWW服务器来进行数据查询。CGI 一般分两种:标准CGI和缓冲CGI。所有的WWW服务器均应支持标准CGI,按标准CGI 编写的程序与具体的WWW服务器无关。而按缓冲CGI编写的程序与WWW服务器有关。 1.2CGI的工作原理 
1.标准CGI 
客户端、服务器、CGI接口与外部程序间的关系可用图1-1表示:如上图所示,服 务器是客户端(如浏览器)与扩展程序之间的通道。当客户端的用户完成了一定 输入工作(比如填充完HTML文档中的FORM表)之后向服务器发出HTTP请求(称为CGI 请求),服务器守护进程接收到该请求后,就创建一个子进程(称为CGI进程)。 该CGI子进程将CGI请求的有关数据设置成环境变量,在外部CGI程序与服务器间建 立两条数据通道(标准I/O),然后启动URL指定的CGI程序,并与该子进程保持同 步,以监测CGI程序的执行状态。子进程通过标准输出流将处理结果传递给服务器 守护进程,守护进程再将处理结果作为应答消息回送到客户端。外部CGI程序通过 环境变量、命令行参数、标准输入输出与WWW服务器进行通讯,传递有关参数和处 理结果。*环境变量:当服务器守护进程创建子进程运行CGI程序时,设置相应的 环境变量和命令行参数,以传递客户端和服务器的有关信息给该子进程。*命令行 参数:命令行参数仅在有HTML文档中有ISINDEX查询的情况下使用。*标准输入输 出:当HTTP请求模式采用POST方式时,CGI程序通过标准输入流和有关环境变量来 获取客户端传输数据;如采用GET方式时,CGI程序直接通过环境变量获取客户端传 输数据。当CGI程序要返回处理结果(一般为HTML文档)给客户端时,它通过标准 输出流将该结果数据传递给服务器守护进程。 
2.缓冲CGI 
标准CGI使用Stdin/Stdout来进行数据通讯,这是由其最初开发环境(Unix操作 
系统)所决定的。但是许多Windows环境下的编程工具(如VB和Delphi等)是不支 持这种I/O方式的,这时就不能用它们来开发基于标准CGI的应用程序。于是有些 服务器提出了缓冲CGI的概念。缓冲CGI亦称为WinCGI。此时CGI扩展程序与服务器 间通过缓冲CGI而不是标准CGI进行通讯,而缓冲CGI与服务器间的通讯还是通过标 准CGI接口。后者由WWW服务器的内置缓冲处理程序实现。这几部分的关系可用图 1-2表示:缓冲CGI的工作原理与标准CGI相似,不同的是当服务器守护进程接收 到客户端的CGI请求时,所建立的CGI子进程将CGI请求的有关数据设置成环境变量 外,还将它们保存在输入缓冲区中;通过缓冲处理程序在外部CGI程序与服务器间 建立两条数据通道(输入/输出缓冲区)。CGI子进程通过输出缓冲区将处理结果 传递给服务器守护进程。此处外部CGI程序通过环境变量和输入/输出缓冲区与WWW 服务器进行通讯,传递有关参数和处理结果。此处环境变量的意义同上,不过这 些环境变量及其相应值保存在输入缓冲区中。此外,输入缓冲区中还存放客户端 的传输数据(如采用POST模式的话)。输出缓冲区用来存放扩展程序的处理结果。 
3.标准CGI与缓冲CGI的区别 
对CGI扩展程序而言,最主要差别在于数据的I/O不同:对缓冲CGI,服务器与CGI 扩展程序间的数据交换是通过缓冲区;而标准CGI是通过标准I/O。使用缓冲CGI可 选择更多的开发工具,可以开发Windows95和WindowsNT下的GUI扩展程序;而使用 标准CGI所选用的开发工具必须支持标准I/O。只有少数几种WWW服务器支持缓冲CGI, 因此基于它的扩展程序兼容性不如标准CGI好。 
1.3CGI与其他WWW技术的关系 
CGI作为WWW服务器的标准扩展技术,由上面CGI的基本原理可知,它和许多其它的 WWW技术密切相关,如HTTP、HTML、MIME和URL等,下面主要就它与前两种技术的关 系进行研究。
1.CGI与HTTP协议 
CGI通过HTTP协议在客户端和服务端进行通讯:*客户端用户代理向服务器发送的 请求是HTTP请求消息。该消息中含有处理用户输入的CGI扩展程序的URL值。*CGI 扩展程序在处理结束后,返回给客户端的应答是HTTP应答消息。因此CGI程序的输 出数据必须符合HTTP应答消息的语法格式,这在基于CGI标准的开发中非常重要。 
2.CGI与HTML语言 
CGI扩展程序的输出数据(HTTP应答消息)一般有两种:符合MIME类型的文档(最 普遍的是HTML文档,表示为text/html);指向其它文档的URL链接。这两种方式都与HTML语言有关,数据的组织须符合HTML语法格式。 
1.4CGI开发的几个问题 
基于WWW的人机交互一般有两种情况:本地交互和通过网络传输的交互。前者是指 客户端用户的输入数据在客户端本地进行处理,然后将处理结果返回给用户,常 见的开发工具有javascript(Netscape开发)和VBScript(Microsoft开发);后 者是指客户端用户输入的数据通过网络传输到WWW服务器,服务器处理结束后将处 理结果返回给客户端用户,常见的开发技术是WWW服务器扩展技术(如CGI,API等)。 此处主要讨论基于标准CGI技术的通过网络进行数据传输的交互实现。对这种人机 交互的实现,主要有三个环节需要解决:如何获取客户端传输的数据,如何提取有 效数据并处理这些数据,如何向客户端返回应答。下面分别结合有关技术,谈谈这 三方面问题的解决。
1.客户端传输数据的获取 
由第三章CGI的原理可知,当服务端守护进程接收到客户端用户代理(如浏览器) 提交的CGI请求时,所创建的CGI子进程会设置与CGI请求内容有关的环境变量,并 建立服务器与外部CGI程序之间通讯的通道(即标准I/O)。CGI程序可以通过环境 变量,标准I/O或命令行参数获取客户端用户输入的数据。数据的获取与请求所采 用的HTTP方法(Method)和用户所使用的请求方式有关。用户通过CGI请求数据一 般有三种方式:HTMLFORM表,ISINDEX,可点击图片(ISMAP或Imagemaps)。后两 种方式是通过命令行参数传递用户的输入数据;在C语言中(下面的举例亦然), CGI程序可以用argc和argv[int]获得这些参数值。而前一种方式则取决于HTTP请 求方法;但不管采用何种方法,都将用到环境变量来传递有关请求内容。 
●获取环境变量 
环境淞康睦啾鸷芏啵突Ф撕头穸说南晗感畔ⅰT谝话鉉GI程序开发中, 下述几个环境变量在数据传递中起着重要作用。 
*GATEWAY—INTERFACE 
CGI程序所使用的CGI标准接口的版本号。如使用的CGI1.1版,该变量表示为
“CGI/1.1” 
*REQUEST—METHOD 
HTTP请求方法。根据该变量值可判断CGI请求所采用的请求方法,以决定是通过Stdin 还是通过环境变量QUERY—STRING获取客户端传输数据。 
*QUERY—STRING 
QUERY—STRING是CGI程序URL中″?″之后的数据。当使用ISINDEX查询或FORM表使 用GET方法时,客户端传输数据可以通过读取该变量而获 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值