在CGI的定义中,对于POST类型的表单,其内容被送到CGI程序的标准输入(在C语言中是stdin),而被传送的长度被放在环境变量CONTENT_LENGTH中。因而我们要做的就是,在标准输入中读入CONTENT_LENGTH长度的字符串。从标准输出读入数据听起来似乎要比从 环境变量中读数据来的要容易一些,其实则不然,有一些细节地方要注意,这在下面的程序中可以看到。特别要注意的一点就是:CGI程序和一般的程序有所不 同,一般的程序在读完了一个文件流的内容之后,会得到一个EOF的标志。但在CGI程序的表单处理过程中,EOF是永远不会出现的,所以千万不要读多于 CONTENT_LENGTH长度的字符,否这会有什么后果,谁也不知道(CGI规范中没有定义,一般根据服务器不同而有不同得处理方法)。
我们来看看到底如何从POST表单收集数据到CGI程序,下面给出了一个比较简单的C源代码:
/*
**post提交表单脚本
*/
#include < stdio.h >
#include < stdlib.h >
#include < string.h >
#define EXTRA 5
/* 4个字节留给字段的名字"data", 1个字节留给"=" */
#define DATAFILE "data.txt"
/* 要被添加数据的文件 */
char *unencode(char *dest_str)
{
register int x = 0, y = 0;
char *temp_str = NULL;
int ascii_one,ascii_two;
temp_str = (char *)malloc(strlen(dest_str) * sizeof(char) +1);
while(dest_str[y])
{
if(dest_str[y] == '+')//处理空格
{
temp_str[x] = ' ';
}
else
if(dest_str[y] == '%')
{
if(dest_str[y+1] >= 'A')//将小写转为大写
ascii_one = ((dest_str[y+1] & 0xdf) - 'A') + 10;
else
ascii_one = dest_str[y+1] - '0';
if(dest_str[y+2] >= 'A')
ascii_two = ((dest_str[y+2] & 0xdf) - 'A') + 10;
else
ascii_two = dest_str[y+2] -'0';
temp_str[x] = ascii_one * 16 + ascii_two;
y += 2;
}
else
temp_str[x] = dest_str[y];
x++;y++;
}
temp_str[x] = '\0';
return (temp_str);
}
int main(void)
{
char *lenstr;
char *data,*input;
long len;
printf("Content-Type:text/html\n\n");
printf("<html><head>");
printf("<title>Response</title>");
printf("</head><body>");
lenstr = getenv("CONTENT_LENGTH");
if(lenstr == NULL || sscanf(lenstr,"%ld",&len)!=1 )
printf("<P>表单提交错误");
else {
FILE *f;
input = (char*)malloc( sizeof(char) * len + 1);
fgets(input, len+1, stdin);
data = unencode(input+EXTRA);
f = fopen(DATAFILE, "a");
if(f == NULL)
printf("<P>对不起,意外错误,不能够保存你的数据 ");
else
fputs(data, f);
fclose(f);
printf("<P>非常感谢,您的数据已经被保存<BR>%s",data);
free(input);
free(data);
}
printf("</body></html>");
return 0;
}
从本质上来看,程序先从CONTENT_LENGTH环境变量中得到数据的字长,然后读取相应长度的字符串。因为数据内容在传输的过程中是经过了编码的,所以必须进行相应的解码。编码的规则很简单,主要的有这几条:
1. 表单中每个每个字段用字段名后跟等号,再接上上这个字段的值来表示,每个字段之间的内容用&连结;
2. 所有的空格符号用加号代替,所以在编码码段中出现空格是非法的;
3. 特殊的字符比如标点符号,和一些有特定意义的字符如“+”,用百分号后跟其对应的ACSII码值来表示。
例如:如果用户输入的是:
Hello there!
那么数据传送到服务器的时候经过编码,就变成了data=Hello+there%21 上面的unencode()函数就是用来把编码后的数据进行解码的。在解码完成后,数据被添加到data.txt文件的尾部,并在浏览其中回显出来。
下面给出了其相应的表单:
< form ACTION="/cgi-bin/collect.cgi" METHOD="POST" >
< P >请输入您的留言(最多80个字符):< BR >< INPUT NAME="data" SIZE="60" MAXLENGTH="80" >< BR >
< INPUT TYPE="SUBMIT" values="确定" >
< /form >
事实上,这个程序只能作为例子,是不能够正式的使用的。它漏掉了很关键的一个问题:当有多个用户同时像文件写入数据是,肯定会有错误发生。而对于一个这样 的程序而言,文件被同时写入的几率是很大的。因此,在比较正式的留言版程序中,都需要做一些更多的考虑,比如加入一个信号量,或者是借助于一个钥匙文件 等。因为那只是编程的技巧问题,在这儿就不多说了。