有限状态机解析HTTP请求

本文介绍了如何使用有限状态机解析HTTP请求。HTTP报文由起始行、头部字段、空行和消息正文组成。解析过程包括读取请求行、请求头部并区分Header与body。程序结构涉及主程序的recv()函数用于接收HTTP数据,以及parse_content()函数进行解析,状态包括解析请求行和解析头部。最后展示了完整代码及运行示例。
摘要由CSDN通过智能技术生成

一、HTTP报文

HTTP的报文格式:

起始行
头部字段

空 行
消息正文
其中起始行和头部字段成为Header,消息正文称为body。Header和body之间一定要有空行隔开。
在这里插入图片描述在这里插入图片描述
请求行的格式:
在这里插入图片描述
如下:
GET /index.html HTTP/1.1
请求方法为GET, url为/index.html,版本为HTTP/1.1

而请求头部就是用 key:value 更详细的方式说明HTTP报文。
而我们要做的就是解析这样的http请求,并发送应答报文给客户端。

二、程序结构

主程序:
在这里插入图片描述

recv() 是从套接字中读取http报文数据到buffer中

解析HTTP请求的主函数:

parse_content()

在parse_content中首先通过parse_line()读取一行,
主状态有解析请求行和解析头部两种状态,初始状态为解析请求行,当解析请求行完毕,状态转移到解析头部字段

//部分代码,非完整代码
HTTP_CODE parse_content(char* buffer, int& checked_index, CHECK_STATE& checkstate, int& read_index, int& start_line)
{
   
//每次读取一行解析
    while ((linestatus = parse_line(buffer, checked_index, read_index)) == LINE_OK)
    {
   
        switch (checkstate)
        {
   
        case CHECK_STATE_REQUESTLINE://解析请求行
        {
   
        //调用解析请求行函数,解析完成后在函数中完成状态转移
            retcode = parse_requestline(szTemp, checkstate);
            break;
        }
        case CHECK_STATE_HEADER://解析头部字段
        {
   
            retcode = parse_headers(szTemp);
            //解析结果被省略了
            break;
        }
        }
    }
    if (linestatus == LINE_OPEN)//不能读取到完整行
    {
   
        return NO_REQUEST;
    }
    else
    {
   
        return BAD_REQUEST;
    }
}

三、完整代码

#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <assert.h>
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <errno.h>
#include <string.h>
#include <fcntl.h>
#include <iostream>
using namespace  std;
constexpr auto BUFFER_SIZE = 4096;
//主状态机状态
//CHECK_STATE_REQUESTLINE 解析请求行;CHECK_STATE_HEADER 解析头部字段
enum CHECK_STATE {
    CHECK_STATE_REQUESTLINE = 0, CHECK_STATE_HEADER, CHECK_STATE_CONTENT };
//从状态机状态,LINE_OK 完整的一行;LINE_OPEN该行尚未读完;LINE_BAD 该行有错误
enum LINE_STATUS {
    LINE_OK = 0, LINE_BAD, LINE_OPEN };
//处理http请求的结果 NO_REQUEST 表示读取的请求结果不完整;GET_REQUEST 读取了完整正确的http请求;BAD_REQUEST表示客户请求有错
enum HTTP_CODE {
    NO_REQUEST, GET_REQUEST, BAD_REQUEST, FORBIDDEN_REQUEST, INTERNAL_ERROR, CLOSED_CONNECTION };
static const 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值