HTTP协议定义Web客户端如何从Web服务器请求Web页面,以及服务器如何把Web页面传送给客户端。HTTP协议采用了请求/响应模型。客户端向服务器发送一个请求报文,请求报文包含请求的方法、URL、协议版本、请求头部和请求数据。服务器以一个状态行作为响应,响应的内容包括协议的版本、成功或者错误代码、服务器信息、响应头部和响应数据。
以下是HTTP请求/响应的步骤:
(1)客户端连接到Web服务器
一个HTTP客户端,通常是浏览器,与Web服务器的HTTP端口(默认为80)建立一个TCP套接字连接。
(2)发送HTTP请求
通过TCP套接字,客户端向Web服务器发送一个文本的请求报文,一个请求报文由请求行、请求头部、空行和请求数据4部分组成。
(3)服务器接受请求并返回HTTP响应
Web服务器解析请求,定位请求资源。服务器将资源复本写到TCP套接字,由客户端读取。一个响应由状态行、响应头部、空行和响应数据4部分组成。
(4)释放连接TCP连接
Web服务器主动关闭TCP套接字,释放TCP连接;客户端被动关闭TCP套接字,释放TCP连接。
(5)客户端浏览器解析HTML内容
客户端浏览器首先解析状态行,查看表明请求是否成功的状态代码。然后解析每一个响应头,响应头告知以下为若干字节的HTML文档和文档的字符集。客户端浏览器读取响应数据HTML,根据HTML的语法对其进行格式化,并在浏览器窗口中显示。
HTTP协议的无状态性
HTTP协议是无状态的(stateless)。也就是说,同一个客户端第二次访问同一个服务器上的页面时,服务器无法知道这个客户端曾经访问过,服务器也无法分辨不同的客户端。HTTP的无状态特性简化了服务器的设计,使服务器更容易支持大量并发的HTTP请求。
持久连接
HTTP1.0使用的是非持久连接,客户端必须为每一个待请求的对象建立并维护一个新的连接。因为同一个页面可能存在多个对象,所以非持久连接可能使一个页面的下载变得十分缓慢,而且这种短连接增加了网络传输的负担。HTTP1.1引入了持久连接,允许在同一个连接中存在多次数据请求和响应,即在持久连接情况下,服务器在发送完响应后并不关闭TCP连接,而客户端可以通过这个连接继续请求其他对象。
转载:http://www.cnblogs.com/fakis/archive/2011/02/25/1976568.html
额外补充(我的一点理解):
1,套接字是什么?有什么用?为什么需要他?
套接字,又有一个名字叫socket,来源于Unix系统的进程通信机制,描述IP地址和端口,是一个通信链的句柄(可以类推理解我们吃饭用的勺子的把柄),很直接的可以从名字“套接字”,就是一个套子,里面装着ip地址、端口和端口号,用来在网络中寻找主机的(通过ip),在寻找主机的端口和端口号的,这样,一个进程的请求就会对应服务器中具体的一个进程的处理,这样网络通信(信息处理)就不会乱掉。至于为什么网络通信中要他,我的理解是,很多客户端都想一台服务器发送请求(网络通信/信息处理),这么多信息体一股脑的都跑到这台主机上,如果ip地址一个人自己跑到,没有门进不来,如果端口跑来,端口(端口号)不知道到主机地址在那,也没用(通过端口可以知道是哪一个进程处理哪一个服务),因此必须捆绑ip地址和端口号一起打包,通过ip地址找到服务器,通过端口找到处理的进程(服务),这样通信才能进行,这也是为什么需要他的原因。
这个是我看百度百科后所理解的一点很浅薄的东西,欢迎大家指正。