原始的HTML语言是设计用来展现静态的数据,它让人使用一种简单的语法展现出丰富的多媒体数据,就像广告广告牌一样。 由于WWW具有相当大的商业用途,因此推出后大受欢迎。可是单纯的静态展示好像缺少了什么? 如果用户需要的数据具有时效性,必需时常更新,这时该怎么办呢? 又或者你想留下用户的数据,让你的网页能跟使用者达到互动的效果,这时又该如何? 由于上述种种需求,于是就诞生了CGI这东东。
CGI是Common GatewayInterface的缩写,中文翻做『共通网关接口』。它是一种标准接口程序,能让你的网页跟WWW server沟通,达到跟使用者互动的效果。 而且透过CGI程序,可以让你动态的产生网页,秀出server上的最新数据。当你link到一个CGI对象时,你取回的文件并非是一份静态数据, 而是一个藉由程序动态产生的HTML数据流。传回来的数据也许分分秒秒都在更改,或者针对使用者的特殊查询而有不同的反应,例如股票市场行情等等。 简单来说,CGI程序就是能够动态产生WWW网页,并让一般使用者经由WWW取用现存在传统信息系统内的数据。
首先,你得认清一个事实:如果数据是天天更新,你绝对不可能写一个很大的HTML文件包含所有的这些更新数据。 万一放在WWW上的数据是分分秒秒都在变动的,那么利用程序自动根据数据产生HTML文件显然是你唯一的选择。 第二,CGI程序可以根据用户输入的要求自动产生HTML格式的数据。因为输入数据是由WWW server负责接收,并非CGI程序本身, 故得找出一个有效率的方法,来做使用者输入参数和产生HTML文件程序间的沟通工作。 CGI本身制订的标准有提到可以藉由环境变量来达成这个目的,而且CGI程序也有能力取得现存在各类数据库里的数据。 这就是为什么我们称之为Common GatewayInterface,因为CGI程序通常就像桥梁或网关一般,沟通着非WWW系统和WWW server (这和下面所说的Web server、HTTP server是一样的,都是指一个架有HTTPd的服务器)。
举个例子来说,你是某家证券公司的大老板,你的公司里已经有一个相当完善的数据库,装满了过去所有的股票价格数据, 现在你想经由WWW提供这些数据给你的顾客们做参考,但是你的数据库系统根本就不懂HTTP这种格式,这时你就需要一个网关程序, 当作股票价格数据库和HTTP server间的桥梁信道,于是CGI程序就诞生了。它可以取得HTTP用户送来的查询指令,转换成现存数据库可以了解的指令, 用以取得数据后,再将数据转换为HTML格式,最后再经由HTTP server传回给使用者,秀在使用者的浏览器上。
根据上述这些要求,CGI程序的确可以用任何程序语言来撰写,只要该语言具有读写档案的能力且该数据文件可被存取即可。 不过这也表示写程序时需要注意安全性的问题,以免数据被用户有意无意的破坏,否则到时候就真的欲哭无泪了。
接下来我要说一些比较理论性的东西,但却是写CGI程序必备的基本知识。一部Web server上一定会跑起HTTPd,这是HTTP的server程序(daemon)。 由于HTTPd牵涉到系统设定问题,所以除非你是系统管理者或是自己架一台server跑起HTTPd,否则一般使用者是没有权跑自己写的CGI程序的。 不过现在另外有个程序叫CGI wrap,它可以透过一种特殊的方法读取userhome/www/cgi-bin里的CGI程序,并且以用户的身份来执行这个CGI程序,所以不虞有被破站的危险。 ind.ntou.edu.tw这部Email and Webserver就有装上CGIwrap,并且全校师生都有账号,是大家练习CGI程序的好去处(相关的使用方法请Email to root@ind.ntou.edu.tw)。
OK! 现在我们假设你的Web server已经设置好执行CGI的环境,并且你有存取cgi-bin目录的权限 (至于HTTPd和TCPwrap的安装与相关设定并不在本篇文章的讨论范围内,有兴趣者请自行到各大bbs站相关布告栏的精华区找找,一定可以找到你所需要的答案)。 当使用者用浏览器link到一个CGI程序时,浏览器会透过HTTP这个通讯协议,送出一个请求(require)给远程(remote)的Web server,Web server就会跑一个HTTPd process, 这个process会去找指定的目录下有没有这个CGI程序,如果有的话HTTPd会启动一个child process来跑这个CGI程序,也因此继承了HTTPd所有的环境变量设定。 这也就是说使用者所输入的要求会经由HTTP通讯协议传送到Web server的HTTPd,再经由环境变量或标准输入设备(STDIN)传递给CGI程序。CGI程序相关的环境变量列表于下:
Environment Variable | Description |
SERVER_SOFTWARE | The type of Web server running the CGI program |
SERVER_NAME | The name of the Web server host |
SERVER_PORT | The port address of the Web server |
GATEWAY_INTERFAC | The version number of the CGI standard |
SERVER_PROTOCOL | The version of HTTP the server is running |
REQUEST_METHOD | The method of requesting data specified by the client |
QUERY_STRING | Request parameters supplied by the client |
SCRIPT_NAME | The resource locator of the CGI program |
REMOTE_HOST | The name of the client host |
REMOTE_ADDR | The Ipaddress if the client host |
AUTH_TYPE | Authorization method,often blank |
REMOTE_USER | The name of the user provided by the client |
REMOTE_IDENT | An identify fot the client user,not often available |
REFERER_URL | How the client got here |
HTTP_ACCEPT | The MIME types accepted by the client |
HTTP_USER_AGENT | The client browser type |
CONTENT_TYPE | The MIME type of data supplied with the request |
CGI程序接收到用户的需求,经过一番处理,然后会将标准输出(执行结果)传送给HTTPd,再经由HTTP交给客户端(client)的浏览器秀出来。 所以CGI程序在标准输出上的执行结果必须要符合HTML格式,而在文件的排版方面当然也要依HTML格式来写,这一点要特别注意一下。