一、URI和URL
1.URI的概念
URI就是由某个协议方案表示的资源的定位标识符,协议方案指的是访问资源所用的协议类型名称。
采用HTTP协议时,协议方案就是http。除此之外,还有ftp、mailto、telnet、file等。标准的URI协议有30种左右。
2.URI和URL的区别和联系
URI用字符串标识某一互联网资源,而URL表示资源的地点,即互联网上所处的位置。所以,URL是URI的子集。
3.URI的格式
表示指定的URI,要使用涵盖全部必要信息的绝对URI、绝对URL以及相对URL。相对URL,是指从浏览器中基本的URI处指定的URL。
我们看一下绝对的URI格式。
使用http:或https:等协议方案名获取访问资源时要指定协议类型,不区分字母大小,最后附一个冒号。
也可使用data:或javascript:这类指定数据或脚本程序的方案名。
字段介绍
(1)登录信息(认证)
指定用户名或密码作为从服务器端获取资源时必要的登录信息,是可选的。
(2)服务器地址
使用绝对的URI必须有需要访问的服务器地址,地址可以是解析的、点分十进制(IPV4)或者是方括号阔起来的IPV6地址名。
(3)服务器端口号
指定服务器连接的网络端口号。是可选的,若用户省略则自动使用默认端口号。
(4)带层次的文件路径
指定服务器上的文件路径来定位指定的资源。
(5)查询字符串
针对已指定的文件路径内的资源,可以使用查询字符串传入任意参数,此项可选。
(6)片段标识符
可以标记出已获取资源中的子资源。是可选项。
二、HTTP协议格式
举个简单的例子。
1.请求
POST /index.html HTTP/1.1
HOST: www.XXX.com
User-Agent:Mozilla/5.0(Windows NT 6.1;rv:15.0) Firefox/15.0
Username=admin&password=admin
起始行开头的POST表示请求访问服务器的类型,称为方法。随后的/index.html指明了请求访问的资源对象,也叫做请求URI。最后的HTTP/1.1,是HTTP的版本号,用来提示客户端使用的HTTP协议功能。
这段请求的内容的意思是:请求访问某台HTTP服务器上的/index.html页面资源。
请求报文是由请求方法、请求URL、协议版本、可选的请求首部字段和内容实体构成的。
2.响应
HTTP/1.1 200 OK
Content-Encoding: gzip
Content-Type: text/html;charset=utf-8
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8" />
<title>Document</title>
</head>
<body>
<p>this is http response</p>
</body>
</html>
起始行开头的HTTP/1.1表示服务器对应的HTTP版本。200 OK表示请求的处理结果的状态码和原因短语。响应报文后以一空行分隔,之后的内容是资源实体的主体。
响应报文基本上是由版本协议、状态码、用以解释状态码的原因短语、可选的响应首部字段以及实体主题构成。
告知服务器意图的HTTP方法
方法 | 作用 |
---|---|
GET | 获取资源 |
POST | 传输实体主体 |
PUT | 传输文件 |
HEAD | 获得文件首部 |
DELETE | 删除文件 |
OPTIONS | 询问支持的方法 |
TRACE | 追踪路径 |
CONNECT | 要求用隧道协议连接代理 |
HTTP响应码
类别 | 原因短语 |
---|---|
1XX | Informational(信息状态码) |
2XX | Success(成功状态码) |
3XX | Redirection(重定向状态码) |
4XX | Client Error(客户端错误状态码) |
5XX | Server Error(服务器错误状态码) |
三、HTTP报文首部
HTTP请求报文
HTTP响应报文
1.HTTP首部信息
HTTP首部字段包括客户端和服务器分别处理请求和响应提供所需要的信息,包括报文主体大小、所使用的的语言、认证信息等。对于客户端用户来说,这些信息中的大部分内容都无须亲自查看。
2.HTTP首部字段结构
HTTP首部字段是由首部字段名和字段值构成的。
首部字段名: 字段值
3.HTTP首部字段类型
HTTP首部字段分为4种类型。
通用首部字段
请求报文和响应报文都会用到的首部。
请求首部字段
从客户端向服务器发送请求报文时使用的首部。补充了请求的附加内容、客户端信息、响应内容和相关优先级等信息。
响应首部字段
从服务器向客户端返回响应报文使用的首部。补充了响应的附加内容,也会要求客户端附加额外的内容信息。
实体首部字段
针对请求报文和响应报文的实体部分使用的首部。补充了资源内容更新时间等与实体有关的信息。
HTTP/1.1规范定义了47种首部字段。
下面介绍几个常见的首部字段。
首部字段名 | 说明 |
---|---|
Content-Type | 实体主体的媒体类型 |
Content-Length | 实体主体的大小(单位:字节) |
Host | 请求资源所在的服务器 |
User-Agent | HTTP客户端程序信息 |
Referer | 对请求URI的原始获取方 |
Location | 令客户端重定向至指定URI |
Cookie(非HTTP/1.1) | 用于客户端存储少量信息。 |
HTTP短链接:
一次请求,一次响应,双方响应一来一回。通常服务器关闭响应。例如:对讲机。
HTTP长链接:
一次性建立连接,然后进行通信。例:打电话的过程。