HTTP服务器—支持CGI协议
一. 项目介绍
利用掌握的TCP/IP协议构建服务器,根据http协议格式解析从客户端接收的请求,处理请求,构造响应并发送给客户端,支持CGI协议,通过设置环境变量和读写标准输入输出的方式进行参数的传递。
二. 技术特点
使用 socket套接字完成构建TCP/IP服务器
使用到 epoll 模型,提高了并发的速度
支持CGI程序,通过设置环境变量和标准输入输出流的方式,进行数据获取
支持HTTP协议的GET和POST请求,且对这两个请求有不同的处理方法
対路径做基本处理:用户给的路径不完整时,可以补充为默认路径
涉及到的技术点:socket套接字,文件操作,管道,进程创建,进程替换,环境变量
三. HTTP协议
1. http协议介绍
HTTP协议(HyperText Transfer Protocol,超文本传输协议)是因特网上应用最为广泛的一种网络传输协议,所有的WWW文件都必须遵守这个标准
HTTP协议基于TCP/IP通信协议来传递数据(HTML 文件, 图片文件, 查询结果等)
HTTP是一个应用层协议,由请求和响应构成,是一个标准的客户端服务器模型。
HTTP是一个无状态的协议,对事务处理是没有记忆的和独立的
HTTP默认的端口号为80,HTTPS的端口号为443。
2. 短链接和长链接
短链接:服务器每次连接只处理一个用户请求,并且客户端接受服务器应答后立刻断开连接,如果客户端没有发出请求,服务器不会专门等待,也不会在完成一个请求后还保持原来的请求,而是会立即断开这次连接
长链接: 服务器在发送响应后一段时间内仍然保持这条连接,允许在这条连接上进行多次请求与响应。
本项目的服务器采用的短链接方式,客户端发送请求,服务端进行请求处理,在服务端完成响应后,会主动断开连接,不会保持请求。
3. http请求与响应过程
从用户在一个浏览器中输入一个网址,到获取到整个页面,中间发生了什么?
域名解析
- 首先浏览器会查询本地 hosts 文件,找相应的域名解析
- 在hosts文件中没有找到,就会在浏览器的缓存中查找是否有该域名的缓存
- 没有找到的话,就会去DNS中获取该域名对应的ip地址
建立连接
- 得到ip地址后,客户端通过路由找到服务器端
- 客户端会先尝试通过TCP/IP协议来和服务器建立连接(三次握手)
获取数据
- 连接建立完成,客户端向服务器端发起请求
- 服务器得到请求,做出相应的业务处理,构造http响应并传回客户端
- 浏览器接收到数据后,根据http协议格式分析响应,并将结果展示到页面上
断开连接
- 服务器在发送数据后会主动断开连接(四次挥手)
- 客服端在接收到数据后会断开连接
这样一次从浏览器到客户端的请求和相应也就完成了。
4. http协议的报文格式
请求报文格式
- 请求首行:方法,url,版本号,三部分中间用空格分离
- 请求头部:以键值对的方式构成,每一个键值对占一行,描述本次协议的属性
- 空行:用来分割body
- body: 请求的内容,GRT方法的请求没有body,POST请求有body
响应报文格式
- 响应首行:版本号,状态码,状态对应的内容,三部分中间用空格分离
- 响应头部:同请求格式一样
- 空行:分割body
- body: 响应的内容
5. get和post方法
http协议的方法有很多:
- GET 获取资源
- POST 向服务器端发送数据,传输实体主体
- PUT 传输文件
- HEAD 获取报文首部
- OPTIONS 询问支持的方法
- TRACE 追踪路径
比较常用的两个方法
GET方法
GET方法没有body,如果GET方法请求的是CGI程序,就要求客户端将参数以键值对的方式放到url中,并且以
?
将参数与CGI程序的路径分割开来,如/cgi?a=1&b=2&c=3因此在url中可以看到
?
的就是GET方法,但是GET是不安全的&#