一、HTTP简介
Http协议(Hyper text transfer protocol,超文本传输协议)简单快速,只需要提供请求方法和路径。而且允许传输任意类型的数据。支持B/S与C/S模式。
Http是面向无连接无状态的,无连接的意思是服务器接收到客户端的请求,处理完,返回客户端,再获得客户端的回应就会断开连接,而不会一直连着,这种面向不连接的传输方式节省资源。无状态是不会记得之前处理的事物,如果之后的传输内容依赖于之前的内容,那么就需要将之前的内容又传输一遍。
一般我们还会看到https(Hyper text transfer protocol secure,超文本传输安全协议),这表示传输是加密的。
Http协议是基于TCP/IP协议的。
二、URL
URI:统一资源标识符(Uniform Resource Identifiers)用来唯一的标识一个资源。
URL:统一资源定位符(UniformResourceLocator)是互联网上用来标识某一处资源的地址。它是一种具体的URI,即URL可以用来标识一个资源,而且还指明了如何locate这个资源。
URN:统一资源命名(uniform resource name)是通过名字来标识资源,比如mailto:java-net@java.sun.com。
URL和URN都是一种URI
HTTP使用URI来传输数据和建立连接。
以下面这个URL为例,介绍下普通URL的各部分组成:
http://www.aspxfans.com:8080/news/index.asp?boardID=5&ID=24618&page=1#name
从上面的URL可以看出,一个完整的URL包括以下几部分:
1.协议部分:该URL的协议部分为“http:”,这代表网页使用的是HTTP协议。在Internet中可以使用多种协议,如HTTP,FTP等等本例中使用的是HTTP协议。在"HTTP"后面的“//”为分隔符
2.域名部分:该URL的域名部分为“www.aspxfans.com”。一个URL中,也可以使用IP地址作为域名使用
3.端口部分:跟在域名后面的是端口,域名和端口之间使用“:”作为分隔符。端口不是一个URL必须的部分,如果省略端口部分,将采用默认端口
4.虚拟目录部分:从域名后的第一个“/”开始到最后一个“/”为止,是虚拟目录部分。虚拟目录也不是一个URL必须的部分。本例中的虚拟目录是“/news/”
5.文件名部分:从域名后的最后一个“/”开始到“?”为止,是文件名部分,如果没有“?”,则是从域名后的最后一个“/”开始到“#”为止,是文件部分,如果没有“?”和“#”,那么从域名后的最后一个“/”开始到结束,都是文件名部分。本例中的文件名是“index.asp”。文件名部分也不是一个URL必须的部分,如果省略该部分,则使用默认的文件名
6.锚部分:从“#”开始到最后,都是锚部分。本例中的锚部分是“name”。锚部分也不是一个URL必须的部分
7.参数部分:从“?”开始到“#”为止之间的部分为参数部分,又称搜索部分、查询部分。本例中的参数部分为“boardID=5&ID=24618&page=1”。参数可以允许有多个参数,参数与参数之间用“&”作为分隔符。
(原文:http://blog.csdn.net/ergouge/article/details/8185219 )
三、消息请求Request
Http请求消息分为以下四个部分:
request line 请求行、 header 请求头部、空行、请求数据
其中请求方法最常用的两种为Get与Post。以约定成俗的一般情况来解释:
Get表示从服务器请求数据,服务器根据请求,返回数据,如点击一个链接,进入一个页面。Get的数据会被完全写在url中,数据不被加密,如果是英文或数字,则原样发送,如果是中文,则会BASE64加密,得出%F3%BA之类的字符,其中F3是十六进制表示。Get方法的数据长度有限制,因为url的长度有限制,不同的浏览器与操作系统不一样。Get方法的url举例:
http://192.168.1.82:8020/juzhong/getURLvalue.html?name1=zhangyiggg&sex1=nuuu&age1=8090
Post表示提交数据到服务器,服务器根据提交的数据更新或增加数据库。如点一个赞,或者下单之类的。Post方式提交的数据是加密的。因为请求的数据是在表单里,而不在url中,所以理论上没有限制,但是不同的WEB服务器会对其提交的数据有长度限制。Post方法的url举例:
http://183.63.131.106:40013/extServiceTest/ghbExtService.do
还有其他的一些请求方法:
HEAD : 类似于get请求,只不过返回的响应中没有具体的内容,用于获取报头
PUT: 从客户端向服务器传送的数据取代指定的文档的内容。
DELETE: 请求服务器删除指定的页面。
CONNECT: HTTP/1.1协议中预留给能够将连接改为管道方式的代理服务器。
OPTIONS: 允许客户端查看服务器的性能。
TRACE: 回显服务器收到的请求,主要用于测试或诊断。
四、消息响应Response
HTTP响应也由四个部分组成,分别是:状态行、消息报头、空行和响应正文。
其中状态码,
状态代码有三位数字组成,第一个数字定义了响应的类别,共分五种类别:
1xx:指示信息--表示请求已接收,继续处理
2xx:成功--表示请求已被成功接收、理解、接受
3xx:重定向--要完成请求必须进行更进一步的操作
4xx:客户端错误--请求有语法错误或请求无法实现
5xx:服务器端错误--服务器未能实现合法的请求
常见状态码:
200 OK //客户端请求成功
400 Bad Request //客户端请求有语法错误,不能被服务器所理解
401 Unauthorized //请求未经授权,这个状态代码必须和WWW-Authenticate报头域一起使用
403 Forbidden //服务器收到请求,但是拒绝提供服务
404 Not Found //请求资源不存在,eg:输入了错误的URL
500 Internal Server Error //服务器发生不可预期的错误
503 Server Unavailable //服务器当前不能处理客户端的请求,一段时间后可能恢复正常
更多状态码http://www.runoob.com/http/http-status-codes.html
五、请求响应流程
以下是 HTTP 请求/响应的步骤:
例如:在浏览器地址栏键入URL,按下回车之后会经历以下流程:
1、浏览器向 DNS 服务器请求解析该 URL 中的域名所对应的 IP 地址;
2、解析出 IP 地址后,根据该 IP 地址和默认端口 80,和服务器建立TCP连接;
3、浏览器发出读取文件的HTTP 请求,该请求报文作为 TCP 三次握手的第三个报文的数据发送给服务器;
4、Web服务器解析请求,定位请求资源。服务器将资源复本写到TCP套接字,把对应的 html 文本发送给浏览器;
5、释放 TCP连接;若connection 模式为close,则服务器主动关闭TCP连接,客户端被动关闭连接,释放TCP连接;若connection 模式为keepalive,则该连接会保持一段时间,在该时间内可以继续接收请求;
6、浏览器将该 html 文本并显示内容; 客户端浏览器首先解析状态行,查看表明请求是否成功的状态代码。然后解析每一个响应头,响应头告知以下为若干字节的HTML文档和文档的字符集。客户端浏览器读取响应数据HTML,根据HTML的语法对其进行格式化,并在浏览器窗口中显示。