参考资料:http://wenku.baidu.com/link?url=EFfS5_2geUIFh5cooqY85VOcaDiqN6e0ROAtXU3M-qShA9Iwi42hI7fwTk2g_j5OhJVJYLwKgdox8RGe-Mrg7D8lb-dXswCRLSl_kzvFOAK
基于参考资料整理,谢谢作者分享。
1.CGI概念
CGI(Common Gateway Interface: 公用网关接口)规定了Web服务器调用其他可执行程序(CGI 程序)的接口协议标准。Web服务器通过调用CGI程序实现和Web浏览器的交互,也就是CGI程序接受Web浏览器发送给Web服务器的信息,进行处理, 将响应结果再回送给Web服务器及Web浏览器。CGI程序一般完成Web网页中表单(Form)数据的处理、数据库查询和实现与传统应用系统的集成等工作。
简单来说,从物理上讲cgi实际是运行在web服务器上的一段程序,提供了同客户端html页面的接口,任何符合cgi标准的程序都是cgi程序。
2.CGI接口标准
CGI接口标准包括标准输入、环境变量、标准输出三部分。
2.1标准输入
CGI程序像其他可执行程序一样,可通过标准输入(stdin)从Web服务器得到输入信息,如Form中的数据,这就是所谓的向CGI程序传递数据的POST方法。这意味着在操作系统命令行状态可执行CGI程序,对CGI程序进行调试。
2.2环境变量
操作系统提供了许多环境变量,它们定义了程序的执行环境,应用程序可以存取它们。Web服务器和CGI接口又另外设置了自己的一些环境变量,用来向CGI程序传递一些重要的参数。CGI的GET方法还通过 环境变量QUERY-STRING向CGI程序传递Form中的数据。
环境变量是文本串(名字/值对),可以被其他程序设置 或者访问。它们是Web服务器传递数据给CGI程序的简单手段,之所以称为环境变量是因为它们是全局变量,任何程序都可以存取它们。
常用环境变量:
HTTP-REFERER:调用该CGI程序的网页的URL。
REMOTE-HOST:调用该CGI程序的Web浏览器的机器名和域名。
REQUEST-METHOD:指的是当Web服务器传递数据给CGI程序时所采用的方法,分为GET和POST两种方法。GET方法仅通过环境变量 (如QUERY-STRING)传递数据给CGI程序,而POST方法通过环境变量和标准输入传递数据给CGI程序,因此POST方法可较方便地传递较多的数据给CGI程序。
SCRIPT-NAME:该CGI程序的名称。
QUERY-STRING:当使用POST方法时,Form中的数据最后放在QUERY-STRING中,传递给CGI程序。
CONTENT-TYPE:传递给CGI程序数据的MIME类型,通常为″application/x-www-form-url encodede″,它是从HTML Form中以POST方法传递数据给CGI程序的数据编码类型,称为URL编码类型。
CONTENT-LENGTH:传递给CGI程序的数据字符数(字节数)。
2.3标准输出
CGI程序通过标准输出(stdout)将输出信息传送给Web服务器。传送给Web服务器的信息可以用各种格式,通常是以纯文本或者HTML文本的形式,这样我们就可以在命令行状态调试CGI程序,并且得到它们的输出
3.CGI的编程实现
CGI 程序实现一般有如下几个主要步骤:
(1)根据POST 方法或GET 方法,接收客户端提交的数据。若以POST 方法提交数据,则程序先从CONTENT_LENGTH 环境变量得到数据的字长,然后从标准输入中读取相应长度的字符串即可得到提交的数据。若以GET 方法提交数据,客户端提交的数据被保存在QUERY_STRING 环境变量中, 通过调用函数getenv(“QUERY_STRING”)来读取数据。
(2)URL 编码的解码。这个过程较为复杂,在URL 编码的规则下:变量之间用“&”分开;变量与其对应值之间用“=”连接,空格符用“+”代替;特殊意义的字符用“%”接相应的十六进制ASCII 码代替。解码即为编码的逆过程。在程序中,对于提取的数据,当发现字符为“+”时,将它转换成空格;当发现字符为“&”时,意味着一个变量/值对的结束,在此处将字符切成几个字符串;当再现字符为“=”时,意味着一个变量/值对的变量名部分的结束,在此再将变量/值对分开。最后将十六进制ASCII 码值表示的特殊字符转换成相应的ASCII 字符。
(3)根据上一部分解析出来的变量/值对,判断客户端请求的含义,并传送消息给应用程序主进程,来完成客户端请求要完成的任务,如系统参数设置、远端设备控制等;然后应用程序将执行结果返回给CGI 进程,由CGI 进程用printf()函数来产生HTML 源代码, 再把执行结果返回给客户端。将编写好的CGI程序编译成可执行文件放在WEB Server 设置的CGI 目录下,CGI 程序就能被正确地执行。
下面是一个简单的CGI程序,它将HTML中Form的信息直接输出到Web浏览器。
# include <stdio.h>
# include <stdlib.h>
main()
{
int i, n ;
printf ("Content-type:text/plain\n\n");
n=0;
if(getenv("CONTENT-LENGTH"))
n=atoi(getenv("CONTENT-LENGTH"));
for (i=0;i<n;i++)
putchar(getchar());
putchar ('n');
fflush(stdout);
}
下面对此程序作一下简要的分析
prinft ("Content-type:text/plain\n\n");
此行通过标准输出将字符串"Content-type:text/plain\n\n"传送给Web服务器。它是一个MIME头信息,它告诉Web服务器随后的输出是以纯ASCII文本的形式。请注意在这个头信息中有两个新行符,这是因为Web服务器需要在实际的文本信息开始之前先看见一个空行。
if (getenv("CONTENT-LENGTH"))
n=atoi (getenv("CONTENT-LENGTH"));
此行首先检查环境变量CONTENT-LENGTH是否存在。Web服务器在调用使用POST方法的CGI程序时设置此环境变量,它的文本值表示 Web服务器传送给CGI程序的输入中的字符数目,因此我们使用函数atoi() 将此环境变量的值转换成整数,并赋给变量n。请注意Web服务器并不以文件结束符来终止它的输出,所以如果不检查环境变量CONTENT- LENGTH,CGI程序就无法知道什么时候输入结束了。
for (i=0;i<n;i++)
putchar(getchar());
此行从0循环到(CONTENT-LENGTH-1)次将标准输入中读到的每一个字符直接拷贝到标准输出,也就是将所有的输入以ASCII的形式回送给Web服务器。
通过此例,我们可将CGI程序的一般工作过程总结为如下几点。
1.通过检查环境变量CONTENT-LENGTH,确定有多少输入;
2.循环使用getchar()或者其他文件读函数得到所有的输入;
3.以相应的方法处理输入;
4.通过"Contenttype:"头信息,将输出信息的格式告诉Web服务器
5.通过使用printf()或者putchar()或者其他的文件写函数,将输出传送给Web服务器。
总之,CGI程序的主要任务就是从Web服务器得到输入信息,进行处理,然后将输出结果再送回给Web服务器。