HTTP概要
Web服务器端:基于HTTP协议,将网页对应文件传输给客户端的服务器端。
HTTP是Hypertext Transfer Protocol的缩写。Hypertext(超文本)是可以根据客户端请求而跳转的结构化信息。这种可跳转的文本称为超文本。
HTTP是以超文本传输的目的而设计的应用层协议,这种协议同样也属于基于TCP/IP实现的协议。
此外,浏览器也属于基于套接字的客户端,因为连接到任意Web服务器端时,浏览器内部也会创建套接字。只不过浏览器会将服务器端传输的HTML格式的超文本解析为可读性较强的视图。
Web服务器端是以HTTP协议为基础传输超文本的服务器端。
上图描述的是HTTP请求和响应的过程。可以看到服务器端响应客户端请求后立即断开连接。也就是说,服务器端不会维持客户端状态。即使同一客户端再次发送请求,服务器端也无法辨认出原先是哪个,而会以相同的方式处理请求。因此,HTTP又称为“无状态的Stateless协议”。
请求消息结构
Web服务器端需要解析并响应客户端请求,客户端和服务器端之间的数据请求方式如下:
请求消息可以分为请求行、消息头、消息体等3部分。其中,请求行含有请求方式(请求目的)信息。典型的请求方式有GET和POST,GET主要用于请求数据,POST主要用于传输数据。
GET/index.html HTTP/1.1
这句话的含义是:“请求(GET)index.html文件,希望以1.1版本的HTTP协议进行通信”
请求行只能通过1行发送,因此,服务器端很容易从HTTP请求中提取第一行,并分析请求行中的信息。
消息头中包含发送请求的(将要接收响应信息的)浏览器信息、用户认证信息等关于HTTP消息的附加信息。
消息体中装有客户端向服务器端传输的数据,为了装入数据,需要以POST方式发送请求。
此外,消息体和消息头之间需要以空行隔开,这样可以避免发生边界问题。
响应消息(Response Message)的结构
响应消息同样也是以三个部分构成:状态行、消息头、消息体;
状态行中含有关于请求的状态信息,这是与请求消息相比最为显著的区别。
状态行中包含的是关于客户端请求的处理结果。
HTTP/1.1 200 OK
上述代码的含义是:“我想用HTTP1.1版本进行响应,你的请求已正确处理(200 OK)”.
表示“客户端请求的执行结果”的数字称为状态码,典型的有:
- 200 OK:成功处理请求。
- 404 Not Found:请求的文件不存在!
- 400 Bad Request:请求方式错误,请检查!
消息头中含有传输的数据类型和长度等信息。上图中的消息头含有如下消息:
服务器端名为SimpleWebServer,传输的数据类型为text/html(html格式的文本数据)。数据长度不超过2048个字节。
最后插入一个空行,之后通过消息体发送给客户端请求的文件数据。
上面就是实现Web服务器端过程中必要的HTTP协议。