HTTP报文的解析过程比较繁琐,基于状态机的思想设计程序会一定程度降低复杂性。
一、从状态机
从状态机状态转移图
从状态机三种状态
- LINE_OK ,完整读取一行
- LINE_OPEN,读取的行不完整
- LINE_BAD,读取的报文有误
从状态机每次从缓冲区读取一行信息,直至读取到 \r\n 表示读取到一行,同时将 \r\n 替换为 \0\0 便于主状态机读取该行,然后再将行起始标志定位到下一行的起始位置。
二、主状态机
主状态机有三种状态
- CHECK_STATE_REQUESTLINE,解析请求行
- CHECK_STATE_HEADER,解析头部信息
- CHECK_STATE_CONTENT,解析正文
主状态机的状态转移图:
主状态机的初始状态是CHECK_STATE_REQUESTLINE,parse_request_line()函数中解析请求行,当解析请求行成功时,解析请求行内部函数将主状态转移至下一个状态。
当请求方法为GET时,请求报文没有请求正文,也就是说解析完头部字段后该报文的解析过程就完成了。
解析请求行比较重要的一点是需要保存url,url对应客户端请求的文档。