Android 网络编程(二) HTTP协议解析

引言

  在日常的开发工作中,我们和服务器端进行通信一般都是基于HTTP 协议,HTTP协议同时也是互联网中最基础的网络协议。我们后面会讲到的一些优秀的开源库,比如说Volley,OKHttp以及Retroit 能够很方便的帮助我们进行Android网络编程的开发,这些库也都是基于HTTP 协议去实现的。

HTTP 简介

什么是HTTP,HTTPS 又是什么?

  超文本传输协议(英文:HyperText Transfer Protocol,缩写:HTTP)是一种用于分布式、协作式和超媒体信息系统的应用层协议。HTTP是万维网的数据通信的基础。HTTP 协议是一个基于 TCP/IP 的应用层网络协议,它不涉及数据包的传输,规定了客户端与服务器端的通信格式。用于从万维网(WWW)服务器传输超文本到本地客户端。HTTP 从1991年发布0.9版开始,经过20多年的发展,不断完善和扩展。
  超文本传输安全协议(英语:HyperText Transfer Protocol Secure,缩写:HTTPS,常称为HTTP over TLS,HTTP over SSL或HTTP Secure)是一种透过计算机网络进行安全通信的传输协议。HTTPS经由HTTP进行通信,但利用SSL/TLS来加密数据包。HTTPS开发的主要目的,是提供对网站服务器的身份认证,保护交换数据的隐私与完整性。这个协议由网景公司(Netscape)在1994年首次提出,随后扩展到互联网上。
  HTTP是明文传输,默认端口号是80,https是ssl加密的传输,身份认证的网络协议,默认端口号是443。在HTTP(应用层) 和TCP(传输层)之间插入一个SSL协议, 就是HTTPS。也可以这样概括:HTTP+加密+认证+完整性保护=HTTPS。所以,我们将下面主要讲述HTTP 协议的内容。

HTTP 协议的特点

  1. 支持C/S(客户端/服务器)模式
  2. 简单快速:客户向服务器请求服务时,只需传送请求方法和路径。请求方法常用的有GET、HEAD、POST,每种方法规定了客户与服务器联系的类型不同。由于HTTP协议简单,使得HTTP服务器的程序规模小,因而通信速度很快。
  3. 灵活:HTTP允许传输任意类型的数据对象。正在传输的类型由Content-Type加以标记。
  4. 无连接:无连接的含义是限制每次连接只处理一个请求。服务器处理完客户的请求,并收到客户的应答后,即断开连接。采用这种方式可以节省传输时间。
  5. 无状态:HTTP协议是无状态协议,无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大。另一方面,在服务器不需要先前信息时它的应答就较快。

HTTP URL 格式

	http://host[":"port][abs_path]

  http 表示使用 HTTP 协议来发送网络请求;host 表示合法的 Internet 主机域名或者IP地址;port 表示端口号,HTTP 协议默认使用 80 端口,也可以另外指定;abs_path 表示指定的 Web 服务器上可用资源的 URI。

HTTP的报文

   HTTP报文是在HTTP应用程序之间发送的数据块。这些数据块以一些文本形式的元信息开头,这些信息描述了报文的内容及含义,后面跟着可选的数据部分。HTTP 协议中的报文,包含两种类型,请求报文和响应报文,分别对应客户端向服务器发送请求以及服务器响应请求这两个过程。

请求报文

在这里插入图片描述
   通常来说一个HTTP请求报文由请求行、请求报头、空行、和请求数据4个部分组成。
   比如说下面这个百度登录账号的请求报文:

POST /v2/api/?login HTTP/1.1                                
Host: passport.baidu.com
Connection: keep-alive
Content-Length: 1190
Cache-Control: max-age=0
Origin: https://www.baidu.com
Upgrade-Insecure-Requests: 1
Content-Type: application/x-www-form-urlencoded
User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8
Referer: https://www.baidu.com/
Accept-Encoding: gzip, deflate, br
Accept-Language: zh-CN,zh;q=0.9
Cookie: HOSUPPORT=1; USERNAMETYPE=3; SAVEUSERID=b566d81871d56eeb18c80c662ea85c; Hm_lvt_90056b3f84f90da57dc0f40150f005d5=1532941064; HISTORY=39a4fd197fced1666d6978e1cb19ad1b140957; BAIDUID=DA60AEA49FA1DD6840BE2312039F50EC:FG=1; PSTM=1537201293; BIDUPSID=8FFCFEFA0567CBC8F1B6222A30D2AA7D; PSINO=2; BDRCVFR[feWj1Vr5u3D]=I67x6TjHwwYf0; pgv_pvi=4792869888; pgv_si=s5375552512; ZD_ENTRY=google; BDORZ=B490B5EBF6F3CD402E515D22BCDA1598; BDRCVFR[4Zjqyl1bxbt]=aeXf-1x8UdYcs; H_PS_PSSID=; UBI=fi_PncwhpxZ%7ETaNj4eZlyAur7XT6G26Ok4TrsxfTmOrKsDt-Z%7EBUOsU8aTCsLjDnHuoWlSLmFAeV8oRrnpuAFam2MPBR7Q%7Eo09ZZHLViaGfHpwUXqsyzpvlFeNoi2R08qKXpyTiTxu9hmG9zqphuRmfz3vw

staticpage=https%3A%2F%2Fwww.baidu.com%2Fcache%2Fuser%2Fhtml%2Fv3Jump.html&charset=UTF-8&token=ca0f35b4ebc6f9fc036a557b6136d593&tpl=mn&subpro=&apiver=v3&tt=1537601390986&codestring=&safeflg=0&u=https%3A%2F%2Fwww.baidu.com%2F&isPhone=false&detect=1&gid=86A55B0-569C-4AD3-A17E-5E2678283A08&quick_user=0&logintype=dialogLogin&logLoginType=pc_loginDialog&idc=&loginmerge=true&splogin=rate&username=18168382659&password=IGuAFtAX9q2%2BynuKoYTjF5XwKnsNmbHO9WfYyRNfcNDUloO8hcS%2BQmF0EUeh8bD5Vrjz895rTzpkCNpsUwSbBP4X9i1Z%2FcLqpRvDcFrdPLfaSehkvoMwOfoQ0OEWYCQVPBD3u%2FxW6bV4Fjr3FsOkZp3ixMGA2cBKtzCepOKGuAA%3D&mem_pass=on&rsakey=QUMyL7s03UXcPdL59MCVlAonrroBSGqt&crypttype=12&ppui_logintime=15606&countrycode=&fp_uid=&fp_info=&loginversion=v4&dv=tk0.242393730115254781537601376012%40UUev9kqTEo0DFU7hAEjQu0n6B-oyBUjyJBn-OxjesmyU21qbQq__qe0TUDkux9k2zn5yz2kRy9pyx2-oTnA6U9kvyDkoTQkJ%7En5yd2kVT2-JdDmzu6ubpuV0nBUj6uUhQ2AhQBxsWNXUlnA6e9k6zDmyxDAoU90FhAVO56uUQBUhAu0lz20jQsXjeLBy_yttC-tERjPSLhEei2eye9kJbzevO4Ty91vd212b2-N-2koznAvUnkNi2Au-n-Jy2A2%7En1qz2R__iedCpFdNp2M9ej%7EO%7ENaJX0SspuaJxjZ9ezULXF3sX3asH6_Hev2myy9kodnkqTn-Vy9kodnkqTDAqy9kodnkqT2A6d2myb2kq_&traceid=78B9A101&callback=parent.bd__pcbs__i7kn49
请求行

  请求行由请求方法,URL字段和HTTP协议的版本组成,格式如下:

Method Request-URI HTTP-Version CRLF

  其中 Method表示请求方法;Request-URI是一个统一资源标识符;HTTP-Version表示请求的HTTP协议版本;CRLF表示回车和换行(除了作为结尾的CRLF外,不允许出现单独的CR或LF字符)。例如上面登录百度账号的请求行就是:

POST /v2/api/?login HTTP/1.1

  HTTP请求方法有8种,分别是GET、POST、DELETE、PUT、HEAD、TRACE、CONNECT 、OPTIONS。其中PUT、DELETE、POST、GET分别对应着增删改查,对于移动开发最常用的就是POST和GET了。

序号方法描述
1GET请求获取Request-URI所标识的资源
2POST在Request-URI所标识的资源后附加新的数据
3HEAD请求获取由Request-URI所标识的资源的响应消息报头
4PUT请求服务器存储一个资源,并用Request-URI作为其标识
5DELETE请求服务器删除Request-URI所标识的资源
6TRACE请求服务器回送收到的请求信息,主要用于测试或诊断
7CONNECTHTTP/1.1协议中预留给能够将连接改为管道方式的代理服务器
8OPTIONS请求查询服务器的性能,或者查询与资源相关的选项和需求
请求报头

  请求行之后会有 0 个或多个请求报头,如果有请求报头,则每行有 1 个请求头,都是以键值对的形式表示,包括头部域的名字和值,中间用 “:” 分隔。

请求头描述
Host请求的主机名,允许多个域名同处一个IP地址,即虚拟主机
User-Agent发送请求的浏览器类型、操作系统等信息
Accept客户端可识别的内容类型列表,用于指定客户端接收那些类型的信息
Accept-Charset客户端可识别的字符集
Accept-Encoding客户端可识别的数据编码
Accept-Language表示浏览器所支持的语言类型
Connection允许客户端和服务器指定与请求/响应连接有关的选项,例如这是为Keep-Alive则表示保持连接。
CookieHTTP请求发送时,会把保存在该请求域名下的所有cookie值一起发送给web服务器。
Transfer-Encoding告知接收端为了保证报文的可靠传输,对报文采用了什么编码方式
请求数据

  请求数据不在GET方法中使用,而是在POST方法中使用。POST方法适用于需要客户填写表单的场合,与请求数据相关的最常用的请求头是Content-Type和Content-Length。

响应保文

在这里插入图片描述
  HTTP的响应报文由状态行、消息报头、空行、响应正文组成,响应正文是服务器返回的资源的内容。
   比如说下面这个百度登录账号的响应报文:

HTTP/1.1 200 OK
Access-Control-Expose-Headers: Trace-ID
Cache-Control: public
Content-Encoding: gzip
Content-Type: text/html
Date: Sat, 22 Sep 2018 07:29:51 GMT
Expires: 0
Last-Modified: Sat, 22 Sep 2018 07:29:50 7SepGMT
P3p: CP=" OTI DSP COR IVA OUR IND COM "
Pragma: public
Server: Apache
Set-Cookie: STOKEN=0e9fa59dc37b18eb2af4e550e3a64720a7ccfafe1c74264009873dcda1c20622; expires=Wed, 09-Dec-2026 07:29:51 GMT; path=/; domain=passport.baidu.com; secure; httponly
状态行

  状态行格式如下:

HTTP-Version Status-Code Reason-Phrase CRLF

  其中,HTTP-Version表示服务器HTTP协议的版本;Status-Code表示服务器发回的响应状态代码;Reason-Phrase表示状态代码的文本描述。例如上面登录百度账号的状态行就是

HTTP/1.1 200 OK

  状态代码有三位数字组成,第一个数字定义了响应的类别,且有五种可能取值:

状态码类型范围描述
100~199指示信息,表示请求已接收,继续处理
200~299请求成功,表示请求已被成功接收、理解、接受
300~399重定向,要完成请求必须进行更进一步的操作
400~499客户端错误,请求有语法错误或请求无法实现
500~599服务器端错误,服务器未能实现合法的请求

  更多关于状态码的细节可以参见HTTP状态码,常见的状态码如下:

状态码描述详解
200OK客户端请求成功
400Bad Request客户端请求有语法错误,不能被服务器所理解
401Unauthorized请求未经授权,这个状态代码必须和WWW-Authenticate报头域一起使用
403Forbidden服务器收到请求,但是拒绝提供服务
500Internal Server Error服务器发生不可预期的错误
503Server Unavailable服务器当前不能处理客户端的请求,一段时间后可能恢复正常
响应报头

  用于服务器传递自身信息的响应,常见的响应报头:

请求头描述
Location用于重定向接受者到一个新的位置,常用在更换域名的时候
Server包含可服务器用来处理请求的系统信息,与User-Agent请求报头是相对应的
WWW-Authenticate必须被包含在 401(未授权的)响应消息中,客户端收到 401 响应消息时候,并发送 Authorization 报头域请求服务器对其进行验证时,服务端响应报头就包含该报头域。

消息报头

  消息报头分为通用报头、请求报头、响应报头、实体报头等。消息头由键值对组成,每行一对,关键字和值用英文冒号“:”分隔。请求报头和实体报头上面解释了,下面主要讲下通用报头和实体报头.

通用报头

  既可以出现在请求报头,也可以出现在响应报头中

请求头描述
Date表示消息产生的日期和时间
Connection允许发送指定连接的选项,例如指定连接是连续的,或者指定“close”选项,通知服务器,在响应完成后,关闭连接
Cache-Control用于指定缓存指令,缓存指令是单向的(响应中出现的缓存指令在请求中未必会出现),且是独立的(一个消息的缓存指令不会影响另一个消息处理的缓存机制)
实体报头

  实体报头用来定于被传送资源的信息,既可以用于请求也可用于响应。请求和响应消息都可以传送一个实体,常见的实体报头为:

请求头描述
Content-Type发送给接收者的实体正文的媒体类型
Content-Lenght实体正文的长度
Content-Language描述资源所用的自然语言,没有设置则该选项则认为实体内容将提供给所有的语言阅读
Content-Encoding实体报头被用作媒体类型的修饰符,它的值指示了已经被应用到实体正文的附加内容的编码,因而要获得Content-Type报头域中所引用的媒体类型,必须采用相应的解码机制。度
Expires实体报头给出响应过期的日期和时间

总结

   以上内容就是HTTP 协议的解析了,下篇文章会写一下HttpClient与HttpURLConnection自己的理解。在文章的最后特别感谢以下两位作者的文章,他们分别是刘望舒大神写的Android网络编程(一)HTTP协议原理郭孝星大神写的Android网络编程:基础理论
   最后的最后,安利给大家两个网络抓包的软件,能够很轻易地查看网页或者手机请求网络的请求报文和响应报文,mac下推荐使用Charles,windows 下推荐使用Fiddler

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值