Android 网络性能优化(4)弱网优化(1)


弱网并没有明确的定义,所以这需要我们根据实际场景来建立一套标准。一般来说有两个角度,即大指标:

  1. 丢包率

  2. 网络延时

上述两个都好理解,网络太复杂,造成丢包率高和网络延时高的原因太多了,比如:

  • 网络拥塞状况下, 服务器处理的策略是丢包,来缓解服务器压力(但是有的服务器策略就是不丢包,排队处理,这是两种完全不同的情况,客户端需要处理的方式完全相反,所以这个需要客户端和服务端来协商)

  • 信号弱

  • 2g网3g网

传输的数据量较大,但是带宽小,就会导致大量数据丢失,表现形式就是网络延时

  • 中间的网络节点挂了

既然没有明确的定义,那我们只能通过各种工具和手段来判断当前是否为弱网环境了。对于丢包率和网络延时,都是可以使用数据来进行衡量的,下面来介绍更细化的指标。

2.2 弱网指标


如下图所示:

弱网指标

  1. httprtt(Http Round-Tip Time)

又称TTFB(Time to first byte),指从客户端请求的第一个字节开始发送到接收到http header的第一个字节的时间差。即 httprtt = 接收第一个字节的时间 - 发送第一个字节的时间。如果httprtt的时间较长,则说明出现了网络延时,也可能是接入的网络质量的问题。

  1. tcprtt (tcp Round-Tip Time)

tcprtt = 通过tcp通道接收到第一个字节的时间 - 发送第一个字节的时间。因为Http是基于Tcp的,所以在复用同一条tcp通道的情况下,httprtt的时间是包含tcprtt时间的。大部分情况下,httprtt已经可以说明问题的原因。

  1. throughput

吞吐量,它是用来衡量单位时间内成功传送数据的数量,是比较权威的、官方的衡量网络质量的指标。最简单的公式: 吞吐量 = C / T ,C为完成的任务总量,T为完成这些任务的时间。

  1. singal strength

指的是无线信号强度,也就是我们的wifi信号格。Android上SDK就可以支持获取了,而iOS则需要通过黑科技来获取。

  1. bandwidth-delay product(带宽时延乘积)

带宽时延乘积,指的是一个数据链路的能力(bit/s)与来回通信延迟(s)的乘积。其结果是以比特(或字节)为单位的一个数据总量,反映的是当前网络通道的最大容量。Tcp中有滑动窗口的概念,会限制发送和接收数据的大小,所以Tcp窗口的大小是直接受带宽时延乘积的影响,来设置接收缓冲区大小和发送缓冲区大小。

2.3 建立弱网标准 / 弱网检测


百度APP移动端网络深度优化实践分享(三):移动端弱网优化篇中,百度使用的是一个循序渐进的过程,通过三个阶段来建立一个弱网标准:

  1. 第一阶段,线下测试

获取预期的阈值,在测试App网络切换、DNS故障时,抓取这些数据

  1. 第二阶段,线上进行验证

通过线下获取到的阈值,在线上可以获取到弱网的比例,找到会出现弱网的场景,进行诊断优化。(比如网络体验最好的微信,也只是在信令的传输上优化到极致)

  1. 第三阶段,线上反复试验

通过反复试验来调整阈值,使得优化更接近业务层。

腾讯的做法也大同小异,都是根据2.2的指标进行数据收集,整理一套达到弱网时的数据标准。但是我们该如何去探测这些数据呢?这需要我们实现一套完整的网络探测架构。

3. 弱网检测

=========================================================================

这部分基本照抄百度的实现了。网络探测是弱网检测的基础,目标是能够即时、正确的检测出网络质量,我们把网络探测分成两个部分,主动网络探测被动网络采集

3.1 主动网络探测


主动检测,就是在触发了某些特定条件后,主动的进行网络检测,并按照一定的条件检查出是否为弱网状态。架构图如下所示:

在这里插入图片描述

3.1.1 策略层

策略层,通过多种策略,使主动探测的即时性和准确性得到提高。主要在网络请求成功和失败的时候触发弱网检测的逻辑。大致分成下面三个逻辑:

  1. 成功时,如何判断进入弱网状态?

检测 httprtt,是否达到弱网的阈值(即设定的 weak-httprtt),大于这个值就会进入弱网检测,为了防止频繁触发探测,加了时间间隔,一般为5~15min

  1. 成功时,如何判断退出弱网状态?

检测 httprtt,是否没有达到阈值(即设定的 good-httprtt),如果小于这个值则切回到正常的网络状态。防止频繁触发探测,加了时间间隔,一般为30s~60s。

在多次实验中,发现如果小于阈值,就一定是正常状态,而大于或等于阈值,并不能证明一定不是正常网络,所以也需要发起网络探测。但是由于这个动作是发生在成功的回调里,所以频次会很高,所以需要加上时间间隔。可能还需要限制次数。

  1. 失败时,如何判断进入弱网状态?

直接进行网络探测,但是由于可能会频繁触发,其检测的条件需要比成功时检测要更加严苛,所以不会在时间上加限制,而是从次数上加限制。

进入网络探测状态后,就轮到基础能力层来实现。

3.1.2 基础能力层

基础能力层就是提供网络探测的手段,一般有两个:

  1. dns query

使用Android系统的默认DNS服务器来查询目标服务器的(核心)域名,DNS查询的超时时间为3s

  1. ping

正所谓“想测网络通不通,不ping百度ping京东”。因为他们的服务器都比较稳定,很少宕机,通过ping这些域名来了解当前网络状态、丢包率等信息。ping的次数为两次,超时时间默认是1s。

为什么要使用这两种手段呢?这是因为网络请求的过程中,主要有 DNS查询、TLS握手、TCP握手。而 DNS Query可以用来获取dns是否出现问题,ping可以用来检测TCP连接的连通性。

除了上面两种手段,应该也有其他网络探测的方式。在执行完这些手段后,将探测数据交给接口层。

3.1.3 接口层

接口层提供网络状态,大致为下面几个:

  • GOOD

DNS查询成功、Ping成功,且没有超时、无丢包

  • BAD

ping失败则为BAD

  • UNKNOWN

无法识别状态

  • OFFLINE

dns查询错误、网关错误,发送dns错误、ping读写错误、接收dns错误、ping地址错误等

3.2 被动网络采集


被动采集,就是每一次网络请求的所有细节都进行记录,并按照一定的条件将原始信息进行上报,上层再根据条件判断是否是弱网状态。cronet(Chromium提供给Android的网络堆栈库)可以提供这个能力,OkHttp应该没有这种能力,所以可以考虑接入 cronet。

被动采集的信息主要有以下三个:

  1. tcprtt

  2. httprtt

  3. throughput

架构图如下所示:

在这里插入图片描述

3.2.1 基础能力层

基础能力层就是采集网络请求的三个参数tcprtt、httprtt、throughput。

(1)tcprtt采集

基于posix和windows的socket编程接口来获取tcprtt。获取时机在连接完成,读完成和写完成;

(2)httprtt采集

基于HTTP协议栈实现,通过计算接收response数据开始和开始发送的时间差,来获取httprtt。获取时机在读首包完成时;

(3)throughput采集

通过计算公式获取bytes总量和时间,基于posix和windows的socket编程接口来获取bytes。获取时机在读完成时记录接收的bytes,在写完成时记录发送的bytes。时间的获取在吞吐量管理模块里完成,获取时机在请求完成和请求销毁时。

3.2.2 策略层

通过获取到的数据进行上报,三种数据对应三种模块,对于上报的时机需要做处理。

(1) 套接字管理模块

使用cronet的话,可以通过 getsockopt()函数获取 tcp_info结构体中的 trcpi_rtt值。其次由于tcprtt的上报比较频繁,所以需要做时间限制,最少间隔 1~3s

(2)吞吐量管理模块

负责吞吐量计算,之前介绍了公式,从网络活动监控器模块获取bytes,但是吞吐量的计算单位是bits,所以将bytes乘以8,。只有GET请求会被列入统计计算,并且至少要累计5个请求才开始统计计算。

排除精准度的干扰,比如 localhost,私有子网上的主机,特定用途的子网主机,可以参考 rfc1918 的规范

(3)网络质量管理模块

从套接字管理模块获取tcprtt,从吞吐量管理模块获取吞吐量,并且在Http协议栈读到首包完成时获取httprtt。

获取到这三个值后,需要经过一些策略限制上报的频次,10s的间隔限制;网络类型不能是UNKNOWN;网络不能频繁切换;rtt和总吞吐量大小各300。

这些限制都是为了排除误差、降低性能损耗。

3.2.3 接口层

接口层提供的状态是对标主动采集的网络状态的,所以也包括 GOOD、BAD、UNKNOWN、OFFLINE

  1. GOOD

3G网、4G网、5G网,任一条件满足即标记为GOOD状态。

通过阈值标记3G和广义的4G,httprtt大于等于273ms,tcprtt大于等于204ms,即标记为3G状态。

小于这两个值则被标记为4G、5G网。

  1. BAD

2G网、httprtt大于1.31s,任一条件满足则标记为BAD状态。阈值需要在网上查询资料,根据业务线调整。

  1. UNKNOWN

非法的httprtt、tcprtt、吞吐量,任一条件满足则标记为UNKNOWN状态。比如初始化的时候,有的值会标为-1

  1. OFFLINE

依赖平台能力进行判断,Android可以利用 ConnectivityManager得到 NetworkInfo,判断网络信息(没有连接wifi、或者wifi无网络等)

4. 弱网状态下的优化

=============================================================================

4.1 使用QUIC进行弱网优化


QUIC是一种udp协议,由google发明,实现了TCP+TLS+HTTP/2,它还有一个更加响亮的名称: Http/3,Cronet库对其进行了支持,Android、iOS平台都可以使用。因为我自身对QUIC并不了解,所以这里并不会给出过多的使用介绍,接下来的一个月内,我会专门学习并写一篇有关 QUIC的文章。

总的来说,QUIC协议本身高效节流的特性,使得它在弱网络环境下可以大施拳脚。那么如何使用它呢?

4.1.1 网络库切换

在进行网络探测,并根据探测结果诊断当前网络状态为弱网时,网络请求进行切换,即将请求库切换到QUIC。

而当网络探测恢复为正常状态时,使用正常的网络库,例如OkHttp。

4.1.2 QUIC预连接

所谓QUIC的预连接,就是在进入弱网状态前提前建立QUIC连接。QUIC有引以为傲的0RTT,但第一次建立连接的时候是需要1RTT的,客户端首先会向服务器发送一个client hello消息,服务器会回复一个server reject消息,这个消息中包括了server config,有了server config后客户端就可以直接计算出密钥,完成0RTT。

所以我们在App启动的过程中会做一次QUIC预连接,将server config拉取下来,这样等进入弱网后走QUIC协议。
自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。

深知大多数初中级Android工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则近万的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年Android移动开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。

img

img

img

img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Android开发知识点,真正体系化!

由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且会持续更新!

如果你觉得这些内容对你有帮助,可以扫码获取!!(备注:Android)

最后

代码真的是重质不重量,质量高的代码,是当前代码界提倡的,当然写出高质量的代码肯定需要一个相当高的专业素养,这需要在日常的代码书写中逐渐去吸收掌握,谁不是每天都在学习呀,目的还不是为了一个,为实现某个功能写出高质量的代码。

所以,长征路还长,大家还是好好地做个务实的程序员吧。

最后,小编这里有一系列Android提升学习资料,有兴趣的小伙伴们可以来看下哦~

《互联网大厂面试真题解析、进阶开发核心学习笔记、全套讲解视频、实战项目源码讲义》点击传送门即可获取!

最后

代码真的是重质不重量,质量高的代码,是当前代码界提倡的,当然写出高质量的代码肯定需要一个相当高的专业素养,这需要在日常的代码书写中逐渐去吸收掌握,谁不是每天都在学习呀,目的还不是为了一个,为实现某个功能写出高质量的代码。

所以,长征路还长,大家还是好好地做个务实的程序员吧。

最后,小编这里有一系列Android提升学习资料,有兴趣的小伙伴们可以来看下哦~

《互联网大厂面试真题解析、进阶开发核心学习笔记、全套讲解视频、实战项目源码讲义》点击传送门即可获取!

  • 18
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值