HTTP协议分析

HTTP协议

HTTP协议简介超文本传输协议(英文:HyperText Transfer Protocol,缩写:HTTP)是应用层协议。HTTP是万维网的数据通信的基础。

 

HTTP协议概述:HTTP是一个客户端终端(用户)和服务器端(网站)请求和应答的标准(TCP)。通过使用网页浏览器、网络爬虫或者其它的工具,客户端发起一个HTTP请求到服务器上指定端口(默认端口为80)。我们称这个客户端为用户代理程序(user agent)。应答的服务器上存储着一些资源,比如HTML文件和图像。我们称这个应答服务器为源服务器(origin server)。在用户代理和源服务器中间可能存在多个“中间层”,比如代理服务器、网关或者隧道(tunnel)。

通常,由HTTP客户端发起一个请求,创建一个到服务器指定端口(默认是80端口)的TCP连接。HTTP服务器则在那个端口监听客户端的请求。一旦收到请求,服务器会向客户端返回一个状态,比如"HTTP/1.1 200 OK",以及返回的内容,如请求的文件、错误消息、或者其它信息。

 

HTTP工作原理:HTTP协议定义Web客户端如何从Web服务器请求Web页面,以及服务器如何把Web页面传送给客户端。HTTP协议采用了请求/响应模型(B/S架构)。客户端向服务器发送一个请求报文,请求报文包含请求的方法、URL、协议版本、请求头部和请求数据。服务器以一个状态行作为响应,响应的内容包括协议的版本、成功或者错误代码、服务器信息、响应头部和响应数据。

以下是 HTTP 请求/响应的步骤:                 

1. 客户端连接到Web服务器
一个HTTP客户端,通常是浏览器,
与Web服务器的HTTP端口(默认为80)建立一个TCP套接字连接。例如,http://www.baidu.com

2. 发送HTTP请求
通过TCP套接字,客户端向Web服务器发送一个文本的请求报文,一个请求报文由请求行(请求首行)、请求头部、空行和请求数据4部分组成。

3. 服务器接受请求并返回HTTP响应
Web服务器解析请求,定位请求资源。服务器将资源复本写到TCP套接字,由客户端读取。一个响应由状态行(相应首行)、响应头部、空行和响应数据4部分组成。

4. 释放连接TCP连接
若connection 模式为
close则服务器主动关闭TCP连接,客户端被动关闭连接,释放TCP连接;若connection 模式为keepalive,则该连接会保持一段时间,在该时间内可以继续接收请求;

5. 客户端浏览器解析HTML内容
客户端浏览器首先解析状态行,查看表明请求是否成功的状态代码。然后解析每一个响应头,响应头告知以下为若干字节的HTML文档和文档的字符集。客户端浏览器读取响应数据HTML,
根据HTML的语法对其进行格式化,并在浏览器窗口中显示。

 

请求格式

响应格式

è¿éåå¾çæè¿°

url:超文本传输协议(HTTP)的统一资源定位符将从因特网获取信息的五个基本元素包括在一个简单的地址中:

 

1传送协议。

2层级URL标记符号(为[//],固定不变)

3访问资源需要的凭证信息(可省略)

4服务器。(通常为域名,有时为IP地址)

5端口号。(以数字方式表示,若为HTTP的默认值“:80”可省略)

6路径。(以“/”字符区别路径中的每一个目录名称)

(7查询。(GET模式的请求参数,以“?”字符为起点,每个参数以“&”隔开,再以“=”分开参数名称与数据,通常以UTF8的URL编码,避开字符冲突的问题)

 

以http://www.baidu.com:80/news/index.html?id=250&page=1 为例, 其中:

http : 协议
www.baidu.com:
服务器(域名)
80
是服务器上的网络端口号
/news/index.html,是
路径
?id=250&page=1,是查询
携带参数
以?区别路径和参数,参数使用键值对方式name=’zs’&age=10,每个键值对使用&符号链接。

 

HTTP请求格式:

提示: 回车符 \r 换行符 \n        

请求首行分析:

请求方式: GET 和 POST 方式

GET请求:地址栏访问、超链接访问都是get请求方式,get请求方式不安全,地址栏大小有限

例:<a href=”#”></a>

POST请求:内容在请求体中,数据安全,理论上内容可以无限

 

请求地址:访问服务器的哪个目录。

请求协议: HTTP版本有1.0和1.1两个版本, 1.0版本建立连接后立即断开,下次访       问需要再次建立连接, 1.1版本 建立连接后可以不用断开,直到不发送信息后   才断开节约了资源;

 

请求头分析:

Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8

表示客户端可以接受的内容类型, 多个值使用;分号隔开 q=0.9 表示权重优先级,*/*表示可以接受任意类型内容;

2、Accept-Language: zh-CN,zh;q=0.8,en-US;q=0.5,en;q=0.3

表示客户端可以接受的语言

3、User-Agent: Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; Win64; x64;

浏览器信息,例如使用的是网井的内核, windows64位系统;

4、Accept-Encoding: gzip, deflate-->>支持的压缩格式

5、Host: localhost:8888====>访问地址

6、Connection: keep-alive --->>保持连接 和HTTP1.1版本有关,默认保持3s

7、Content-Type: application/x-www-form-urlencoded

表单提交时才有可能出现,表示表单的数据类型,使用url编码,url编码 % 16位数

8、Content-Length: 7 --->post请求 请求体长度

9、Upgrade-Insecure-Requests: 1-->>告诉服务器,浏览器可以处理https协议、

 

请求空行分析:

就是一个分隔符,用来区分请求头和请求体的;

 

请求体分析:

只有POST请求才有请求体,

因此 POST请求 请求体中存放的是表单提交的键值对。

name=’zs’&age=10

 

HTTP响应格式

 

响应首行(状态行)分析:

HTTP/1.1 200 OK

包含 协议-->>HTTP/1.1, 响应码(状态码)--->>200 , 状态码描述--->>OK

状态码:

200: 服务器很好的处理了客户端的请求,一切 OK

302: 重定向

304:通常表示资源文件在服务器没有更改,而浏览器端又有缓存,这时候回送   304 状体码通知浏览器拿本地的缓存显示

404:表示客户端访问的资源路径有问题或者资源问题不存在

500:表示服务器出现了 异常.

 

响应头部分析:

server: Apache-Coyote/1.1--->> 服务器版本号

Set-Cookie: JSESSIONID=ECA8005D1235BBB6B9CFCC338A8206FD;

                 Path=/03test; HttpOnly学cookie时在讲

Content-Type: text/html;charset=ISO-8859-1(西欧编码,要改成UTF-8)响应字符集,告诉浏览器以什么样的字符集解码;

3、Content-Length: 265  响应体长度

4、Date: Fri, 23 Jun 2017 13:45:01 GMT 发送日期 少8个小时;

5、Expires: -1、Cache-control:no-cache、Pragma:no-cache 三个响应头一起使用,         表示禁止浏览器缓存当前页面. 每个浏览器厂商对认识的禁止头不同因此三个一起使用。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值