一、HTTP报文
HTTP的报文格式:
起始行
头部字段
空 行
消息正文
其中起始行和头部字段成为Header,消息正文称为body。Header和body之间一定要有空行隔开。
请求行的格式:
如下:
GET /index.html HTTP/1.1
请求方法为GET, url为/index.html,版本为HTTP/1.1
而请求头部就是用 key:value 更详细的方式说明HTTP报文。
而我们要做的就是解析这样的http请求,并发送应答报文给客户端。
二、程序结构
主程序:
recv() 是从套接字中读取http报文数据到buffer中
解析HTTP请求的主函数:
parse_content()
在parse_content中首先通过parse_line()读取一行,
主状态有解析请求行和解析头部两种状态,初始状态为解析请求行,当解析请求行完毕,状态转移到解析头部字段
//部分代码,非完整代码
HTTP_CODE parse_content(char* buffer, int& checked_index, CHECK_STATE& checkstate, int& read_index, int& start_line)
{
//每次读取一行解析
while ((linestatus = parse_line(buffer, checked_index, read_index)) == LINE_OK)
{
switch (checkstate)
{
case CHECK_STATE_REQUESTLINE://解析请求行
{
//调用解析请求行函数,解析完成后在函数中完成状态转移
retcode = parse_requestline(szTemp, checkstate);
break;
}
case CHECK_STATE_HEADER://解析头部字段
{
retcode = parse_headers(szTemp);
//解析结果被省略了
break;
}
}
}
if (linestatus == LINE_OPEN)//不能读取到完整行
{
return NO_REQUEST;
}
else
{
return BAD_REQUEST;
}
}
三、完整代码
#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <assert.h>
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <errno.h>
#include <string.h>
#include <fcntl.h>
#include <iostream>
using namespace std;
constexpr auto BUFFER_SIZE = 4096;
//主状态机状态
//CHECK_STATE_REQUESTLINE 解析请求行;CHECK_STATE_HEADER 解析头部字段
enum CHECK_STATE {
CHECK_STATE_REQUESTLINE = 0, CHECK_STATE_HEADER, CHECK_STATE_CONTENT };
//从状态机状态,LINE_OK 完整的一行;LINE_OPEN该行尚未读完;LINE_BAD 该行有错误
enum LINE_STATUS {
LINE_OK = 0, LINE_BAD, LINE_OPEN };
//处理http请求的结果 NO_REQUEST 表示读取的请求结果不完整;GET_REQUEST 读取了完整正确的http请求;BAD_REQUEST表示客户请求有错
enum HTTP_CODE {
NO_REQUEST, GET_REQUEST, BAD_REQUEST, FORBIDDEN_REQUEST, INTERNAL_ERROR, CLOSED_CONNECTION };
static const