超文本传输协议(HyperText Transfer Protocol, HTTP):
一种无状态的,以请求/应答方式运行的协议,它使用可扩展的语义和自描述消息格式,与基于网络的超文本信息系统灵活的互动
虽然HTTP名字中有传输两个字,但实际上它并没有做传输的事情,HTTP协议数据的传输是交由TCP协议来进行的。
无状态的意思是本身不会去存储用户的信息。
可扩展的语义是可以在协议的基础上添加自己的一些需求,比如头部的字段,带来了很大的灵活性。
自描述消息格式的意思是消息类型可以是文本类型、图片类型和音视频的一些数据,根据消息的类型就可以知道数据是什么类型。
1.HTTP的报文格式
HTTP协议的请求报文和响应报文的结构基本相同,由三大部分组成:
- 起始行(start line):描述请求或响应的基本信息
- 头部字段集合(header):使用key-value形式更详细的说明报文
- 消息正文(entity):实际传输的数据,它不一定是纯文本,可以是图片、视频等二进制数据
2.请求行报文格式
- 请求方法:如GET/POST/PUT/HEAD,表示对资源的操作
- 请求目标:通常是一个URI,标记了请求方法要操作的资源
- 版本号:表示报文使用的HTTP协议版本
3.响应行报文格式
- 版本号:表示报文使用的HTTP协议版本
- 状态码:一个三位数,用代码的形式表示处理的结果,比如200是成功,500是服务器错误
- 原因:作为数字状态码补充,是更详细的解释文字,帮助人理解原因
4.HTTP头字段
头部字段是key-value的形式,key和value之前用“:”分隔,最后用CRLF换行表示字段结束。比如前后端分离时经常遇到的要与后端协商传输数据的类型“Content-type:application/json”,这里key就是“Content-type”,value就是“application/json”。HTTP头字段非常灵活,不仅可以使用标准里的Host、Connection等已有头、也可以任意添加自定义头,这就给HTTP协议带来了无线的扩展可能。
头字段注意事项:
- 字段名不区分大小写,字段名里不允许出现空格,可以使用连字符“-”,但不能使用下划线“_”。字段名后面必须紧接着":",不能有空格,而":"后的字段值前可以有多个空格;
- 字段的顺序是没有意义的,可以任意排列不影响语义;
- 字段原则上不能重复,除非这个字段本身的语义允许,例如Set-Cookie;
5.常用头字段
HTTP协议中有非常多的头字段,但基本上可以分为四大类:
- 请求字段:请求头中的头字段;如Host,Referer
- 响应字段:响应头中的头字段;如Server
- 通用字段:在请求头和响应头里都可以出现,如Content-type,Connection
HTTP请求的完整过程
当用户在浏览器输入网址回车后,网络协议都做了哪些工作呢?
-
首先干活的是浏览器应用程序,他要解析出URL中的域名
根据域名获取对应的IP地址,首先从浏览器缓存中查看,如下可以查看浏览器中域名对应的IP的解析
chrome://net-internals/#events
如果没有则从本机域名解析文件hosts(/etc/hosts)中查看,还没有则从LDNS(Localdnsserver)、Rootserver域名服务器、国际顶级域名服务商的DNS的层层解析
拿到IP地址后,浏览器就可以发起与服务器的三次握手
-
握手建立后,就开始组装HTTP请求报文,发送报文
-
服务器收到请求报文之后开始,请求报文解析,生成响应数据,发送响应数据
-
浏览器收到响应之后,开始渲染页面