Android复习系列⑥之《网络面试》

1.http是什么?http的工作机制?http报文?

Hypertext Transfer Protocol 超文本传输协议

1.1 http工作机制:

浏览器:

  1. 用户输入地址后回车或点击链接
  2. 浏览器拼装http报文并发送给服务器
  3. 服务器处理请求后发送响应报文给浏览器
  4. 浏览器解析响应报文并使用渲染引擎显示到界面

手机app:

  1. 用户点击或界面自动触发联网请求
  2. android 代码调用拼装http报文并发送请求到服务器
  3. 服务器处理请求后发送响应报文给手机
  4. android代码处理响应报文并做出相应处理(存储数据,显示数据到界面等)

1.2 URL和http报文

URL格式分三部分:协议类型、服务器地址(和端口号)、路径(path)
如:http://baidu.com/user?sex=man

报文格式分为请求报文和响应报文。

请求报文:
在这里插入图片描述
响应报文:
在这里插入图片描述

2. HTTP请求方法和状态码

请求方法 :

GET-----------获取资源;没有body
POST---------增加或修改资源;有body
PUT-----------修改资源;有body
DELETE-----删除资源;没有body
HEAD--------与GET类似,但服务器只通过HTTP响应头返回资源的信息(如文件大小,类型等),响应报文段的数据实体为空

状态码

1xx------------临时性消息(请求已被接受,需要继续处理,如100(继续发送)、101(正在切换协议))
2xx------------成功
3xx------------重定向(如301(永久移动)、302(暂时移动)、304(内容未改变))
4xx------------客户端错误(如400(客户端请求错误)、404(找不到内容))
5xx------------服务器错误

客户端错误和服务端错误分开,利于程序员调试。

3.Get和Post的区别

标准答案(参考w3schools):

  • GET在浏览器回退时是无害的,而POST会再次提交请求。
  • GET请求会被浏览器主动cache,而POST不会,除非手动设置。
  • GET请求只能进行url编码,而POST支持多种编码方式。
  • GET请求参数会被完整保留在浏览器历史记录里,而POST中的参数不会被保留。
  • GET请求在URL中传送的参数是有长度限制的,而POST没有。
  • 对参数的数据类型,GET只接受ASCII字符,而POST没有限制。
  • GET比POST更不安全,因为参数直接暴露在URL上,所以不能用来传递敏感信息。
  • GET参数通过URL传递,POST放在Request body中。
  • GET产生的URL地址可以被Bookmark,而POST不可以。

“很遗憾,这不是我们要的回答!”

请告诉我真相。。。

如果我告诉你GET和POST本质上没有区别你信吗?

让我们扒下GET和POST的外衣,坦诚相见吧!

HTTP只是个行为准则,而TCP才是GET和POST怎么实现的基本。业界不成文的规定是,(大多数)浏览器通常都会限制url长度在2K个字节,而(大多数)服务器最多处理64K大小的url。超过的部分,恕不处理。如果你用GET服务,在request body偷偷藏了数据,不同服务器的处理方式也是不同的,有些服务器会帮读出数据,有些服务器直接忽略,所以,虽然GET可以带request body,也不能保证一定能被接收到哦。

GET和POST还有一个重大区别,简单的说:
GET产生一个TCP数据包;POST产生两个TCP数据包。

长的说:

对于GET方式的请求,浏览器会把http header和data一并发送出去,服务器响应200(返回数据);

而对于POST,浏览器先发送header,服务器响应100 continue,浏览器再发送data,服务器响应200 ok(返回数据)。

因为POST需要两步,时间上消耗的要多一点,看起来GET比POST更有效。因此Yahoo团队有推荐用GET替换POST来优化网站性能。但这是一个坑!跳入需谨慎。为什么?

  1. GET与POST都有自己的语义,不能随便混用。

  2. 据研究,在网络环境好的情况下,发一次包的时间和发两次包的时间差别基本可以无视。而在网络环境差的情况下,两次包的TCP在验证数据包完整性上,有非常大的优点。

  3. 并不是所有浏览器都会在POST中发送两次包,Firefox就只发送一次。

4.HTTP的Header解析

扩充知识:DNS查询 Domain Name System 即域名查询系统,通过域名(如api.github.com,域名方便我们记)查询ip地址

Header的作用: HTTP消息的元数据(metadata),主要有:

在这里插入图片描述
最常见的Content-Type,主要有4种

  1. text/html

    请求web页面时返回响应的类型,Body中返回html文本,格式如下
    在这里插入图片描述

  2. x-www-form-urlencoded

    web页面纯文本表单的提交方式
    在这里插入图片描述

    对应retrofit的代码:

    在这里插入图片描述

  3. multipart/form-data

    web页面含有二进制文件时的提交方式
    在这里插入图片描述
    对应retrofit代码:
    在这里插入图片描述

  4. application/json,image/jpeg,application/zip

    单项内容(文本或非文本都可以),用于WebApi的响应或者POST/PUT的请求

    1. 请求中提交json,如:{“name”:“rengwuxian”,“gender”:“male”}
      对应retrofit代码:
      在这里插入图片描述
    2. 请求中提交二进制内容:
      对应retrofit代码:
      在这里插入图片描述

5.TCP/IP协议族

概念:一系列协议组成的一个网络分层模型

1.为什么要分层?

因为网络的不稳定性

具体分层:
在这里插入图片描述
应用层:HTTP、FTP、DNS
传输层:TCP、UDP
网络层:IP
数据链路层:以太网、Wi-Fi

2.TCP连接

TCP概述:TCP把连接作为最基本的对象,每一条TCP连接都有两个端点,这种端点我们叫作套接字(socket),它的定义为端口号拼接到IP地址即构成了套接字,例如,若IP地址为192.3.4.16 而端口号为80,那么得到的套接字为192.3.4.16:80。

什么叫连接?
通信双方建立确认可以通信,不会讲对方的消息丢弃,即为建立连接。

为什么要有长连接?
因为移动网络并不在internet中,而是在运营商的内网,并不具有真正的公网ip,因此当某个TCP连接在一段时间不通信后,网关会出于性能考虑关闭这条TCP连接和网关的连接通道,导致TCP连接被动关闭

长连接的实现方式
心跳机制。即在一定时间间隔内,使用TCP连接发送超短无意义消息来让网关不能讲自己定义为空闲连接,从而防止网关将自己关闭。
此外,长连接并不是永久连接的。如果一段时间内(具体的时间长短,是可以在header当中进行设置的,也就是所谓的超时时间),这个连接没有HTTP请求发出的话,那么这个长连接就会被断掉。

3.TCP为什么建立连接是三次握手,关闭连接却是四次挥手呢?
在这里插入图片描述
字段含义:主要了解下ACK(确认)、SYN(同步)、FIN(终止)

序列号seq:占4个字节,用来标记数据段的顺序,TCP把连接中发送的所有数据字节都编上一个序号,第一个字节的编号由本地随机产生;给字节编上序号后,就给每一个报文段指派一个序号;序列号seq就是这个报文段中的第一个字节的数据编号。

确认号ack:占4个字节,期待收到对方下一个报文段的第一个数据字节的序号;序列号表示报文段携带数据的第一个字节的编号;而确认号指的是期望接收到下一个字节的编号;因此当前报文段最后一个字节的编号+1即为确认号。

确认ACK:占1位,仅当ACK=1时,确认号字段才有效。ACK=0时,确认号无效

同步SYN:连接建立时用于同步序号。当SYN=1,ACK=0时表示:这是一个连接请求报文段。若同意连接,则在响应报文段中使得SYN=1,ACK=1。因此,SYN=1表示这是一个连接请求,或连接接受报文。
SYN这个标志位只有在TCP建产连接时才会被置1,握手完成后SYN标志位被置0。

终止FIN:用来释放一个连接。FIN=1表示:此报文段的发送方的数据已经发送完毕,并要求释放运输连接

PS:ACK、SYN和FIN这些大写的单词表示标志位,其值要么是1,要么是0;ack、seq小写的单词表示序号。

三次握手过程解析
在这里插入图片描述
第一次握手:建立连接时,客户端发送syn包(syn=j)到服务器,并进入SYN_SENT状态,等待服务器确认;SYN:同步序列编号(Synchronize Sequence Numbers)。

第二次握手:服务器收到syn包,必须确认客户的SYN(ack=j+1),同时自己也发送一个SYN包(syn=k),即SYN+ACK包,此时服务器进入SYN_RECV状态;

第三次握手:客户端收到服务器的SYN+ACK包,向服务器发送确认包ACK(ack=k+1),此包发送完毕,客户端和服务器进入ESTABLISHED(TCP连接成功)状态,完成三次握手。

三次握手总结建立连接的时候, 服务器在LISTEN状态下,收到建立连接请求的SYN报文后,把ACK和SYN放在一个报文里发送给客户端。

四次挥手过程解析
在这里插入图片描述
1)客户端进程发出连接释放报文,并且停止发送数据。释放数据报文首部,FIN=1,其序列号为seq=u(等于前面已经传送过来的数据的最后一个字节的序号加1),此时,客户端进入FIN-WAIT-1(终止等待1)状态。 TCP规定,FIN报文段即使不携带数据,也要消耗一个序号。

2)服务器收到连接释放报文,发出确认报文,ACK=1,ack=u+1,并且带上自己的序列号seq=v,此时,服务端就进入了CLOSE-WAIT(关闭等待)状态。TCP服务器通知高层的应用进程,客户端向服务器的方向就释放了,这时候处于半关闭状态,即客户端已经没有数据要发送了,但是服务器若发送数据,客户端依然要接受。这个状态还要持续一段时间,也就是整个CLOSE-WAIT状态持续的时间。

3)客户端收到服务器的确认请求后,此时,客户端就进入FIN-WAIT-2(终止等待2)状态,等待服务器发送连接释放报文(在这之前还需要接受服务器发送的最后的数据)。

4)服务器将最后的数据发送完毕后,就向客户端发送连接释放报文,FIN=1,ack=u+1,由于在半关闭状态,服务器很可能又发送了一些数据,假定此时的序列号为seq=w,此时,服务器就进入了LAST-ACK(最后确认)状态,等待客户端的确认。

5)客户端收到服务器的连接释放报文后,必须发出确认,ACK=1,ack=w+1,而自己的序列号是seq=u+1,此时,客户端就进入了TIME-WAIT(时间等待)状态。注意此时TCP连接还没有释放,必须经过2∗∗MSL(最长报文段寿命)的时间后,当客户端撤销相应的TCB后,才进入CLOSED状态。

6)服务器只要收到了客户端发出的确认,立即进入CLOSED状态。同样,撤销TCB后,就结束了这次的TCP连接。可以看到,服务器结束TCP连接的时间要比客户端早一些。

四次挥手总结:关闭连接时,服务器收到对方的FIN报文时,仅仅表示对方不再发送数据了但是还能接收数据,而自己也未必全部数据都发送给对方了,所以己方可以立即关闭,也可以发送一些数据给对方后,再发送FIN报文给对方来表示同意现在关闭连接,因此,己方ACK和FIN一般都会分开发送,从而导致多了一次。

常见面试题

【问题1】为什么连接的时候是三次握手,关闭的时候却是四次握手?

答:因为当Server端收到Client端的SYN连接请求报文后,可以直接发送SYN+ACK报文。其中SYN报文是用来同步的,ACK报文是用来应答的。
但是关闭连接时,当Server端收到FIN报文时,很可能并不会立即关闭SOCKET,所以只能先回复一个ACK报文,告诉Client端,“你发的FIN报文我收到了”。只有等到我Server端所有的报文都发送完了,我才能发送FIN报文,因此不能一起发送。故需要四步挥手。

【问题2】为什么TIME_WAIT状态需要经过2MSL(最大报文段生存时间)才能返回到CLOSE状态?

答:虽然按道理,四个报文都发送完毕,我们可以直接进入CLOSE状态了,但是我们必须假象网络是不可靠的,有可以最后一个ACK丢失。所以TIME_WAIT状态就是用来重发可能丢失的ACK报文。在Client发送出最后的ACK回复,但该ACK可能丢失。Server如果没有收到ACK,将不断重复发送FIN片段。所以Client不能立即关闭,它必须确认Server接收到了该ACK。Client会在发送出ACK之后进入到TIME_WAIT状态。Client会设置一个计时器,等待2MSL的时间。如果在该时间内再次收到FIN,那么Client会重发ACK并再次等待2MSL。所谓的2MSL是两倍的MSL(Maximum Segment Lifetime)。MSL指一个片段在网络中最大的存活时间,2MSL就是一个发送和一个回复所需的最大时间。如果直到2MSL,Client都没有再次收到FIN,那么Client推断ACK已经被成功接收,则结束TCP连接。

【问题3】为什么不能用两次握手进行连接?

答:3次握手完成两个重要的功能,既要双方做好发送数据的准备工作(双方都知道彼此已准备好),也要允许双方就初始序列号进行协商,这个序列号在握手过程中被发送和确认。
(第一次握手告知服务端,第二次握手服务端告知客户端装备好了,第三次握手客户端告诉服务端专备好了。)

【问题4】如果已经建立了连接,但是客户端突然出现故障了怎么办?

TCP还设有一个保活计时器,显然,客户端如果出现故障,服务器不能一直等下去,白白浪费资源。服务器每收到一次客户端的请求后都会重新复位这个计时器,时间通常是设置为2小时,若两小时还没有收到客户端的任何数据,服务器就会发送一个探测报文段,以后每隔75秒钟发送一次。若一连发送10个探测报文仍然没反应,服务器就认为客户端出了故障,接着就关闭连接。

详细可以阅读两张动图-彻底明白TCP的三次握手与四次挥手

4.TCP和UDP的区别

  1. 基于连接与无连接;
  2. 对系统资源的要求(TCP较多,UDP少);
  3. UDP程序结构较简单;
  4. 流模式与数据报模式 ;
  5. TCP保证数据正确性,UDP可能丢包
  6. TCP保证数据顺序,UDP不保证。

6.http和https

HTTP over SSL 的简称,即工作在SSL(或TLS)上的http。https 通过在 http 协议下添加了一层 ssl 协议对数据进行加密从而保证了安全。说白了,就是加密通信的http。

工作原理:

在客户端和服务器之间协商出一套对称秘钥,每次发送信息之前讲内容加密,收到之后解密,达到内筒加密传输。

为什么不直接使用非对称加密?
非对称加密由于使用了复杂的数学原理,因此计算相当复杂,如果完全使用非对称加密来加密通信内容,会严重影响网络通信的性能。

http 与 https 的区别主要如下:

  1. https 需要到 CA 申请证书,很少免费,因而需要一定的费用
  2. http 是明文传输,安全性低;而 https 在 http 的基础上通过 ssl 加密,安全性高
  3. http 使用的默认端口是80;https使用的默认端口是 443

建议阅读:网络面试题

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值