作者:字节终端技术——覃量
前言
端智能,顾名思义就是在端上跑AI模型。端智能作为目前火热的一个新方向,在业界已经开始崭露头角。阿里、谷歌、快手等大企业都在积极布局端智能,用端上AI来优化各种业务场景并取得了非常突出的效果。
字节Client AI团队深耕端智能领域,并在今年早些时候与西瓜视频合作落地了端智能视频预加载方案,取得了不错的结果。本篇我们通过这个案例,带大家一起来揭开端智能的面纱,看看端上AI在实际中是如何应用提高业务效果的。
一、场景
1.0 场景介绍
西瓜视频预加载这个场景非常简单: 在播放当前视频时,客户端会对后续3个视频,每个视频预加载固定800K的缓存。让用户在播放到后续的视频时可以快速起播,获得更为流畅的播放体验。
但这样一个固定的策略也有一些非常明显的问题:
- 用户大部分情况下不会看完800K的buffer,而是简单浏览内容后就划到下一个视频,造成带宽的浪费
- 在用户仔细浏览视频内容时,如果没有足够的buffer,容易造成起播失败或者卡顿,影响用户体验
最理想的预加载策略其实是使『预加载大小和播放大小尽量匹配,用户在起播阶段会看多少,我们就提前加载多少,即不会造成浪费,又不会影响用户体验』。
1.1 深入解析
但实际情况千变万化,想要用户看多少我们就提前加载多少是一件基本不可能做到的事情。这时我们有了一个想法,如果我们可以预测用户接下来的行为模式, 比如 知道他接下来会 『 快 速切换视频』 还是 『慢速消费视频』 的话, 是不是 就可以辅助优化我们的预加载策略了 ?
事实上用户在一段时间内的行为模式是具有一定规律的:这个用户的『手速快慢』、对『互动的倾向性』、是不是在『碎片化时间』、是否是『工作日』等等。我们可以通过这些规律来预测用户的行为模式,进而得到一个更佳的预加载策略。比如我们预测用户接下来很大概率会进行『快速浏览视频』这种模式,此时更符合用户需要的预加载策略可能就是『减少预加载的缓存大小 & 增加预加载的视频个数』,反之亦然。
1.2 突破方向
这时我们会发现优化这个场景的关键可以被转换成这样一个问题:如何预测端上用户的行为模式?
其中又有这么几个子问题:
-
使用『规则』还是『模型』来进行预测?
-
规则
- 优点:简单、开发成本低、可以快速验证方案效果
- 缺点:只能应对简单场景,场景复杂度越高,规则会变得愈发的复杂,导致开发和维护成本变高
-
模型
- 优点:可以应对复杂场景、做更为精细化的策略
- 缺点:开发成本较高、周期也更长
-
一般来说
-