目录
本文参照小码哥的网络协议视频记录
HTTP
HTTP(Hyper Text Transfer Protocol),译为超文本传输协议。是互联网中应用最广泛的应用层协议之一。设计HTTP最初的目的是:提供一种发布和接收HTML页面的方法,由URI来标识具体的资源。
URI和URL的关系:URI包含了URL。比如说(URI)html/login.html和(URL)http://localhost:8080/hello/html/login.html,两个都可以标识一个具体的资源,只不过一个是在局部或者某些条件下是唯一的,一个是全网唯一的。
后面用HTTP来传递的数据格式不仅仅是HTML,应用非常广泛。
HTML(Hyper Text Markup Language):超文本标记语言。用普通的文本就能表达出超出文本范围内的内容,用以编写网页。
版本
1991年,HTTP/0.9版本只支持GET请求方法获取文本数据(比如HTML文档)。且不支持请求头,响应头等,无法向服务器传递太多信息。
1996年,HTTP/1.0版本支持POST,HEAD等请求方法。支持请求头,响应头等,支持更多种数据类型(不再局限于文本数据)。浏览器的每次请求都需要与服务器建立一个TCP连接,请求处理完成后立即断开TCP连接。
1997年,HTTP/1.1(最经典,适用最广泛的版本)支持PUT、DELETE等请求方法,采用持久连接(Connection: keep-alive),多个请求可以共用同一个TCP连接。
2015年,HTTP/2.0
2018年,HTTP/3.0
标准
HTTP的标准由万维网协会(W3C),互联网工程任务组(IETF)协调制定,最终发布了一系列的RFC(Request For Comments,可以译为:请求意见稿。一旦审核通过了,就会成为正式的标准)。HTTP/1.1最早是在1997年的RFC 2068中记录的,该规范在1999年的RFC 2616中已作废,2014年又由RFC 7230系列的RFC取代。HTTP/2标准于2015年5月以RFC 7540正式发表,取代HTTP/1.1成为HTTP的实现标准。1996年3月,清华大学提交的适应不同国家和地区中文编码的汉字统一传输标准被IETF通过为RFC 1922,成为中国大陆第一个被认可为RFC文件的提交协议。
报文格式
在传输层的段中,首部右边紧挨着的就是应用层的数据。
首部行可以叫做请求头,实体主体可以叫做请求体。空格和回车换行应不多不少,缺一不可。
ABNF
ABNF(Augmented BNF) 是BNF(Backus-Naur Form,译为:巴科斯-瑙尔范式)的修改,增强版。在RFC 5234中声明:ABNF用作internet中通信协议的定义语言。ABNF是最严谨的HTTP报文格式描述形式,脱离ABNF谈论HTTP报文格式,往往都是片面,不严谨的。
关于HTTP报文格式的定义:RFC 2616 4.HTTP Message(旧),RFC 7230 3.Message Format(新)
报文格式
整体
/ | 任选一个 |
* | 0个或多个。2*表示至少2个,3*6表示3到6个 |
() | 组成一个整体 |
[] | 可选(可有可无) |
当start-line是request-line的时候,代表是请求报文,当start-line是status-line时,表示是一个响应行,也叫状态行。下面有0个或多个header-field,每个后面都有回车换行,最后还有一个回车换行。下面是消息体,分别叫做请求体或响应体。
为什么start-line后面没有CRLF呢?因为在start-line内部是有CRLF的。
核心规则
request-line
request-line = methods SP request-target SP HTTP-version CRLF
HTTP-version = HTTP-name "/" DIGIT "." DIGIT
HTTP-name = %x48.54.54.50 ; HTTP
例如:GET /hello/ HTTP/1.1
SP:空格。"/":与/不同的是,用""包裹的/是固定的"/"字符,同理"."也是。DIGIT:一个数字。
%x48