网络编程 - HTTP协议

目录

HTTP协议格式

 一,请求格式

1.1 URL的基本格式

1.2 方法(method)

1.3 请求头header 

 二,响应格式

2.1 状态码


HTTP协议格式

HTTP协议与之前讲的TCP/IP协议不同,HTTP协议要分为两个部分——请求和响应,也就是一种"一问一答" 结构模型的协议。

如何查看HTTP协议请求和响应的协议?在这里使用的是一款叫Fiddler的抓包工具。

 一,请求格式

1. 首行

请求的第一行,由三个部分组成,使用空格分开:

1)GET,HTTP请求的"方法"(method)

2)URL,唯一资源定位符,描述一个资源在网络上的位置,具体由什么构成下面再说。

3)版本号, HTTP/1.1

2.请求头(header)

是一个键值对结构的数据(可以有多组),每一个键值对都占一行,键和值之间使用:空格 来区分

3.空行

请求头header的结束标记

4.正文(body)

有的HTTP请求有,有的没有,上面的图就没有

1.1 URL的基本格式

url在计算机中十分重要,它不仅仅在HTTP中涉及,在Java中的jdbc设置数据源setUrl也使用过。URL是用来描述一个资源在网络上的所处位置。

  • 协议方案名:不必多说,类似的还有https://
  • 登录信息:现在几乎不会使用了
  • 服务器地址:可以是IP地址,也可以是域名
  • 服务器端口号:通过IP地址可以找到是哪台主机,但是一台主机可能有多个服务器程序,使用端口号来区分是哪个程序。这里的端口号可能会省略,例如:对于http请求,如果省略,就默认访问80端口;对于https请求,如果省略,就默认访问443端口。
  • 文件路径:描述你要访问服务器的哪个资源,这个看上去有点像目录结构,但实际上,服务器不一定是以目录形式来存储数据。
  • 查询字符串(query string) :一种键值对结构的数据,是以?开头,可以有多个键值对,键值对之间使用&来分割,键和值使用=来分割。(注意:这里的键值对是有程序员自己定义的,不像header中的键值对是有标准规定的)
  • 片段标识符:可以通过这个来实现页面的跳转,有点类似于看小说时,点章节名,就能跳转到那个章节。

注意:对于query string 来说,如果 value 部分要包含一些特殊符号的话,往往需要进行 urlencode操作,有点类似于转义字符。比如:+ ?:/ 等这些符号在url中有特殊用途,如果在value中使用,可能会使浏览器对于url的识别出现问题。所以要对这些符号进行"转义",+就要写成%2B。另外所有的中文都要转义。

1.2 方法(method)

方法说明
GET获取资源
POST传输实体主体

PUT

传输文件
HEAD获得报文首部
DELETE删除文件
OPTIONS询问支持的方法
TRACE追踪路径
CONNECT要求用隧道协议连接代理
LINK建立和资源之间的联系
UBLIKE断开连接的关系

这里最常用的方法只有两个—— GET和 POST,所以主要介绍这两种方法的区别:

  1. 这两种方法没有本质上的区别,但在使用习惯上,还是存在一些差异:GET经常把传递到服务器的数据放到 query string 中;POST 则是经常将数据放到 body 中。(注意:GET也可以使用body中,POST也可以使用 query string,但是使用的前提是服务器/客户端都是按照一样的方式处理,不能一边使用query string,另一边使用 body)
  2. 语义上的差异:GET大部分是用来获取数据;POST大部分是用来提交数据(比如:登录和上传操作)

这里还有一些错误说法需要区分:

1) GET请求能传递的数据是有上限的,POST请求能传递的数据是无上限的。✖           

  • 该说法是一个"历史遗留"问题,因为早期的浏览器硬件资源匮乏,针对GET请求的URL长度做出了限制,而实际上RFC文档没有明确规定URL的长度,就目前来说,URL的长度也可以非常长。

2) GET请求传递的数据不安全,POST请求传递的数据更安全。✖                                 

  • 错误的依据 :使用GET实现登录,点击登录会使用户名和密码放到url中,进一步显示到浏览器地址栏里,就会被人看到;而POST则是在body中,不会在界面上显示出来,所以更安全。                                                                                                                   
  • 但是实际上那些黑客也能通过抓包工具获取到body,通常来说,“安全”是指你传递的数据不容易被黑客获取,或者获取到之后不容易被破解。因为我们的密码会进行加密,所以即使黑客拿到也不容易破解。所以此处的安全与POST无关,关键在于加密。

3) GET只能传递文本数据,POST可以传递文本和二进制数据。✖                                   

  • GET也可以使用body,body中是可以放二进制                                                         
  • GET也可以通过base64转码将二进制数据转换成文本数据,放到query string中

4) GET是幂等的,POST不是幂等的。(不完全正确)                                                       

  • 幂等是指输入相同的值,输出的值都是一样的。而GET和POST是否幂等,这取决于它们的代码是如何实现的。只不过RFC文档建议GET幂等。

5) GET可以缓存,POST不可以缓存。(不完全正确)                                                       

  • 这也取决于是否幂等,如果幂等则可以缓存

1.3 请求头header 

这里的键值对有很多,这里挑一些重要的讲一下:

1.)host:表示服务器主机地址和端口

2)Content-Length:body中的数据长度

3)Content-Type:body中的数据格式

body中的格式有很多种:

请求中:1. json 2. form表单格式 3. form-data格式...

响应中:1. html 2. css 3. js 4. json 5. 图片....

4)User-Agent:描述你使用什么设备上网

5)Referer:描述当前页面是从哪个页面跳转过来的

6)Cookie

浏览器在本地存储数据的一种机制,浏览器中的数据来自服务器,但是在程序运行过程中也是有一些数据需要在浏览器这边存储,并在下次访问时再发给服务器,比如说,上次访问时间,用户身份信息,累计访问次数....这些临时数据都存储在浏览器。

但是为什么不把这些数据存储在本地文件中呢?这是因为浏览器考虑到安全性,禁止网页直接访问你电脑中的文件系统,造成你自身用户数据的泄露。为了保证安全性,又能进行数据存储,所以引入了Cookie(实际上也是按照硬盘文件的方式存储,但是浏览器把操作文件给封装了,网页只能往Cookie中存储键值对,也就是字符串)。

Cookie往往是从服务器返回的数据(也可以是网页自己生成的)

Cookie存储到浏览器所在的主机的硬盘上,并且按照域名来存储(每一个域名多可以存自己当Cookie,彼此之间互不影响)

Cookie是按照键值对的形式来组织的,这里的键值对也是程序员自定义的,后续再请求这个服务器的时候,就会把 Cookie中内容自动昂带入到请求中,发给服务器,服务器通过 Cookie的内容做一些逻辑上的处理。

 二,响应格式

 1. 首行

1)版本号 HTTP/1.1

2)状态码(200)描述请求的结果

3)状态码描述(OK)

2.响应头(header)

也是一个键值对结构的数据(可以有多组),每一个键值对都占一行,键和值之间使用:空格 来区分。

3.空行

4.正文(body)

正文内容可能很长,也有很多种格式,比如:HTML,CSS,JS,JSON,XML,图片,字体....,响应也可以没有正文,看情况。

2.1 状态码

 这里重点讲一些常见的状态码:

  • 2XX:表示成功,200最常见
  • 3XX:表示重定向,比如:一个网站更换了网址,就可以给旧网址挂一个重定向响应,访问旧网址时就会自动跳转到新网站。 301表示永久重定向;302表示临时重定向。
  • 4XX:表示请求报错。404表示访问的资源在服务器上不存在;403表示访问的资源没有权限。
  • 5XX:表示服务器出错了。
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

一叶祇秋

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值