目录
分析源码:源码顺序main->startup->accept_request -> excute_cgi
对tinyhttpd的理解:
它是一个轻量型的http服务器。
我们可以从其中很好的理解http服务器的概念,下载链接Tiny HTTPd download | SourceForge.net
在ubuntu上运行程序:
下载完成后需要对代码以及makefile进行修改
1.33行改为 void* accept_request(void *);
void* accept_request(void *pclient)
{
int client = *(int*)pclient;
……
unimplemented(client);
return NULL;
……
close(client);
return NULL;
}
2.源码436行和481行的变量类型改为 socklen_t
3.495行改为:
if (pthread_create(&newthread , NULL, accept_request,(void*)&client_sock) != 0)
4.makefile修改为:
gcc -W -Wall -o httpd httpd.c -lpthread
运行:
打开ubuntu终端,进入管理员用户 su root
进入到文件夹tinyhttpd文件夹下 make 一下
最后输入./httpd生成端口
首先我们了解一下相关内容:
分析源码:源码顺序main->startup->accept_request -> excute_cgi
函数部分解析:
socket典型应用:
socket套接字socket是什么?套接字是什么?_编程的朝圣之路-CSDN博客
将用户输入得URL,向服务器发送请求,服务器分析URL,将对应得网页内容返回给浏览器,浏览器再经过渲染,将文字图片,视频,文字等元素呈现给用户。
socket(协议域,socket类型,指定协议)
绑定:
bind函数把一个本地协议地址赋予一个套接字。对于网际协议,协议地址是32位的IPv4地址或是128位的IPv6地址与16位的TCP或UDP端口号的组合。
getsockname()函数:
如果端口为0调用getsockname()函数,动态分配一个端口。
监听listen函数:
监听事件的函数,给节点绑定事件监听器 ,当监听到有事件时就立即调用处理函数。listen作用:当socket创建套接字时,它被假设为一个主动套接字,也就是说,它是一个将调用connect发起连接的客户端套接字。listen函数把一个未连接的套接字转换成一个被动套接字,指示内核应接受向该套接字的连接请求。第二个参数规定了内核应该为相应套接字排队的最大连接个数。
accept()函数:
服务端进入了监听状态后,通过调用 accept()
函数,来从内核获取客户端的连接,如果没有客户端连接,则会阻塞等待客户端连接的到来。
代码理解:
void* accept_request(void*); //处理连接,子线程
void bad_request(int); /*404错误*/
void cat(int, FILE*); //处理文件,读取文件内容,发送到客户端
void cannot_execute(int); /*500错误处理函数*/
void error_die(const char*);//错误处理函数处理
void execute_cgi(int, const char*, const char*, const char*);//cgi函数调用
int get_line(int, char*, int);//从缓冲区读取一行
void headers(int, const char*);//服务器成功响应,返回200
void not_found(int); /*请求内容不存在404*/
void serve_file(int, const char*);//处理文件请求
int startup(u_short *); //初始化服务器
void unimplemented(int); //501仅仅实现了get或者post方法,其他方法错误处理
1.创建套接字、监听、指定或者绑定端口、以及返回绑定的端口号:
int startup(u_short* port)
{
int httpd = 0; //定义服务器socket描述符
struct sockaddr_in name;//定义sockaddr_in型结构体用来绑定服务器端的IP地址和端口
/*建立 服务器端 socket */
httpd = socket(PF_INET, SOCK_STREAM, 0);//PF_INET 地址类型ipv4-- SOCK_STREAM是socket类型--0是自动选定协议类型
if (httpd == -1)
error_die("socket");//错误判断
memset(&name, 0, sizeof(name));
name.sin_family = AF_INET;//地址类型ipv4
name.sin_port = htons(*port);//端口转化为网络字节序
name.sin_addr.s_addr = htonl(INADDR_ANY);//本机任意可用ip地址,把本机字节序转化为网络字节序
if (bind(httpd, (struct sockaddr*)&name, sizeof(name)) < 0)//绑定地址
error_die("bind");
/*如果当前指定端口是 0,则动态随机分配一个端口*/
if (*port == 0) /* 如果端口号=0,则随机选取可用端口*/
{
socklen_t namelen = sizeof(name);
if (getsockname(httpd, (struct sockaddr*)&name, &namelen) == -1)//
error_die("getsockname");
*port = ntohs(name.sin_port);//修改端口号,网络字节序转化成本地字节序
}
/*开始监听*/
if (listen(httpd, 5) < 0)
error_die("listen");
/*返回 socket id */
return(httpd);
}
2.创建线程处理http头部信息
void* accept_request(void* pclient)
{
char buf[1024];//缓冲区
int numchars;
char method[255];
char url[255];
char path[512];//路径
size_t i, j;
struct stat st;//文件状态信息
int cgi = 0; //标志是否调用CGI程序
char* query_string = NULL;
int client = *(int*)pclient;//建立连接的socket描述符
numchars = get_line(client, buf, sizeof(buf));//获取一行HTTP请求报文
i = 0; j = 0;
//提取其中的方法post或get到method
while (!ISspace(buf[j]) && (i < sizeof(method) - 1))//根据空格定位方法
{
method[i] = buf[j];
i++; j++;
}
method[i] = '\0';
//tinyhttpd只实现了get post 方法
if (strcasecmp(method, "GET") && strcasecmp(method, "POST"))//如果不是get或者post方法就会打印出错误
{
unimplemented(client);
return NULL;
}
//cgi为标志位,1表示开启CGI解析(POST方法)
if (strcasecmp(method, "POST") == 0)
cgi = 1;
i = 0;
//跳过method后面的空白字符
while (ISspace(buf[j]) && (j < sizeof(buf)))
j++;
//获取url
while (!ISspace(buf[j]) && (i < sizeof(url) - 1) && (j < sizeof(buf)))
{
url[i] = buf[j];
i++; j++;
}
url[i] = '\0';
//如果是get方法,url可能带?参数
if (strcasecmp(method, "GET") == 0)
{
query_string = url;
while ((*query_string != '?') && (*query_string != '\0'))
query_string++;
if (*query_string == '?')
{
//带参数需要执行cgi,解析参数
cgi = 1;
*query_string = '\0';
query_string++;
}
}
//以上 将起始行 解析完毕
sprintf(path, "htdocs%s", url);
//如果path是一个目录,默认设置首页为index.html
if (path[strlen(path) - 1] == '/')
strcat(path, "index.html");
//函数定义: int stat(const char *file_name, struct stat *buf);
//函数说明: 通过文件名filename获取文件信息,并保存在buf所指的结构体stat中
//返回值: 执行成功则返回0,失败返回-1,错误代码存于errno(需要include <errno.h>)
if (stat(path, &st) == -1) {
//访问的网页不存在,则不断的读取剩余的请求头部信息,并丢弃错误404
while ((numchars > 0) && strcmp("\n", buf)) /* read & discard headers */
numchars = get_line(client, buf, sizeof(buf));
not_found(client);
}
else
{
//访问你的网页存在则进行处理
//S_IFDIR 判断是否为目录
if ((st.st_mode & S_IFMT) == S_IFDIR)
strcat(path, "/index.html");
//S_IXUSR:文件所有者具有可执行权限,
//S_IXGRP:用户组具有可执行权限
if ((st.st_mode & S_IXUSR) ||
(st.st_mode & S_IXGRP) ||
(st.st_mode & S_IXOTH))
cgi = 1;
if (!cgi)
//将静态文件返回
serve_file(client, path);
else
execute_cgi(client, path, method, query_string);
}
//THHP协议是面向无连接的,所以要关闭
close(client);
return NULL;
}
3.CGI执行
input:由父进程向子进程的输入管道
output:由子进程向父进程的输出管道
1、让子进程去执行cgi,父进程去做I/O操作。首先将子进程的标准输入重定向为input[0],将子进程的标准输出重定向为output[1],这样,子进程的输入来自父进程,子进程的输出是输出到父进程。通过管道进行父子进程的通信。
2、父进程通过recv接收来自客户端的表单输入,并且通过write传给子进程,子进程收到父进程的输入后,执行cgi脚本,执行完后,输出给父进程。父进程通过read读取到子进程的输出后,再通过send发送到客户端。
过程:
- 判断是GET请求还是POST请求,如果是GET请求丢弃请求头,如果是POST请求,获得Content-Length。接下来判断请求长度是否合法,如果请求不合法,调用bad_request。
- 接下来处理请求成功的情况,先send“正确,HTTP 状态码 200“。
- 建立cgi_output和cgi_input管道。失败调用cannot_execute。
- fork一个进程,如果是子进程,调用cgi脚本。
- 将读写(STDOUT STDIN)文件描述符与cgi_output[1]和cgi_input[0]绑定。关闭另外两个描述符。
- 设置环境变量,execl执行cgi。
- 若为父进程,关闭cgi_input的读取端和cgi_output的写入端。
- 如果为POST请求,需要写入cgi_input,cgi_input输出端已重定向为STDIN 。
- 父进程从cgi_output读出结果,关闭管道,等待子进程结束。
void execute_cgi(int client, const char* path, const char* method, const char* query_string)
{
char buf[1024];
int cgi_output[2];
int cgi_input[2];
pid_t pid;
int status;
int i;
char c;
int numchars = 1;
int content_length = -1;
buf[0] = 'A'; buf[1] = '\0';
if (strcasecmp(method, "GET") == 0)
/*把所有的 HTTP header 读取并丢弃*/
while ((numchars > 0) && strcmp("\n", buf)) /* read & discard headers */
numchars = get_line(client, buf, sizeof(buf));
else /* POST */
{
/* 对 POST 的 HTTP 请求中找出 content_length */
numchars = get_line(client, buf, sizeof(buf));
while ((numchars > 0) && strcmp("\n", buf))
{
/*利用 \0 进行分隔 */
buf[15] = '\0';
/* HTTP 请求的特点*/
if (strcasecmp(buf, "Content-Length:") == 0)
content_length = atoi(&(buf[16]));
numchars = get_line(client, buf, sizeof(buf));
}
/*没有找到 content_length */
if (content_length == -1) {
/*错误请求*/
bad_request(client);
return;
}
}
/* 正确,HTTP 状态码 200 */
sprintf(buf, "HTTP/1.0 200 OK\r\n");
send(client, buf, strlen(buf), 0);
/* 建立管道,进程写管道*/
if (pipe(cgi_output) < 0) {
/*错误处理*/
cannot_execute(client);
return;
}
/*建立管道,进程读管道*/
if (pipe(cgi_input) < 0) {
/*错误处理*/
cannot_execute(client);
return;
}
if ((pid = fork()) < 0) {
/*错误处理*/
cannot_execute(client);
return;
}
if (pid == 0) /* child: CGI script */
{
char meth_env[255];
char query_env[255];
char length_env[255];
/* 把 STDOUT 重定向到 cgi_output 的写入端 */
dup2(cgi_output[1], 1);
/* 把 STDIN 重定向到 cgi_input 的读取端 */
dup2(cgi_input[0], 0);
/* 关闭 cgi_input 的写入端 和 cgi_output 的读取端 */
close(cgi_output[0]);
close(cgi_input[1]);
/*设置 request_method 的环境变量*/
sprintf(meth_env, "REQUEST_METHOD=%s", method);
putenv(meth_env);
if (strcasecmp(method, "GET") == 0) {
/*设置 query_string 的环境变量*/
sprintf(query_env, "QUERY_STRING=%s", query_string);
putenv(query_env);
}
else { /* POST */
/*设置 content_length 的环境变量*/
sprintf(length_env, "CONTENT_LENGTH=%d", content_length);
putenv(length_env);
}
/*用 execl 运行 cgi 程序*/
execl(path, path, NULL);
exit(0);
}
else { /* parent */
/* 关闭 cgi_input 的读取端 和 cgi_output 的写入端 */
close(cgi_output[1]);
close(cgi_input[0]);
if (strcasecmp(method, "POST") == 0)
/*接收 POST 过来的数据*/
for (i = 0; i < content_length; i++) {
recv(client, &c, 1, 0);
/*把 POST 数据写入 cgi_input,现在重定向到 STDIN */
write(cgi_input[1], &c, 1);
}
/*读取 cgi_output 的管道输出到客户端,该管道输入是 STDOUT */
while (read(cgi_output[0], &c, 1) > 0)
send(client, &c, 1, 0);
/*关闭管道*/
close(cgi_output[0]);
close(cgi_input[1]);
/*等待子进程*/
waitpid(pid, &status, 0);
}
}
全部代码:tinyhttpd代码