• 博客(8)
  • 收藏
  • 关注

原创 BIGO | imo实时语音传输优化揭秘

​2020年新冠疫情持续蔓延全球,亿万人的生活因此发生了巨大的改变,人们对实时音视频通话的日常需求也越来越大。作为BIGO公司旗下重要的全球性即时通讯产品imo为全球2亿多用户提供优质稳定的即时通讯服务,在2020年上半年全网通话时长提升30%以上,开斋节(穆斯林节日)更是提升50%以上。是什么技术力量支撑让imo能够适应全球各式各样的网络环境和用户类型,在各类竞品中脱颖而出,为imo全球化的战略保驾护航,乘风破浪,迎难而上的呢?接下来我们就结合imo的语音传输业务和大家探讨一下。一、imo实时语.

2021-01-23 17:39:38 3350 5

原创 BIGO 实时计算平台建设

​一、业务背景BIGO全球音视频业务对数据的实时能力要求越来越高,数据分析师希望多维度实时看到新增用户、活跃用户等业务数据以便尽快掌握市场动向,机器学习工程师希望实时拿到用户的浏览、点击等数据然后通过在线学习将用户偏好快速加入到模型中,以便给用户推送当前最感兴趣的内容,APP开发工程师希望能够实时监控APP打开的成功率、崩溃率。这些实时数据的能力都要依靠实时计算平台来提供。从业界来看,实时化的趋势正在加速,本文将介绍BIGO基于flink的实时计算平台的建设经验和成果。二、平台介绍..

2021-01-20 14:23:55 400 1

原创 BIGO实验平台设计之置信检验

1 摘要A/B 实验或A/B 测试是目前互联网企业数据驱动业务决策的基石,大多数互联网企业通过A/B 实验衡量如新策略对用户体验, 企业营收的影响, 然后决策是否进行产品或策略迭代。以BIGO为例,平均每周,包括直播平台Bigo Live和短视频平台Likee同时进行着上百组包含策略,产品,UED,运营的实验。从实验平台设计的角度来看,一方面,高频的产品策略迭代使得从工程和算法角度对实验平台系统的高效性,,置信检验计算的准确性,流量分配的有效性提出了更高的要求。另一方面,直播和短视频平台作为典.

2021-01-13 16:59:21 570 1

原创 BIGO技术 | Graph Embedding在直播推荐召回

一、概述推荐系统已经成为互联网平台的流量分发中枢,其核心架构主要包含三层:1)Recall层,负责从全量的item池里筛选出用户可能感兴趣的item;2)Rank层,根据推荐系统的整体目标对Recall层召回的item进行排序后截取topN;3)Rerank层,综合排序目标、用户体验和平台生态对Rank层选取的item做最终的展示布局。召回模块决定了排序效果的上限,Bigo Live直播推荐早期的召回主要是基于两种方式:1)主播热度,例如主播的观看人数、点赞人数...

2021-01-11 17:45:24 952

原创 BIGO技术 | 内容流多目标排序优化

一、前言BIGO旗下应用有多个内容流推荐场景,用户在内容流可以浏览图片、视频、音乐、链接等内容,推荐系统在内容的个性化分发中,发挥着重要的作用。本文将结合我们在BIGO内容流推荐中深度学习的具体实践,重点分享在多目标排序优化中的实践经验。二、排序中多目标模型的应用内容流场景是天然的多目标场景,核心目标是推荐用户感兴趣的内容,提升用户时长;兼顾点赞、关注、评论、分享等不同维度的目标,优化用户体验。多个目标如何建模;如何在样本分布不均衡时充分学习;如何调权融合,是多目标排序要...

2021-01-11 14:17:53 981

原创 BIGO安全建设

BIGO全球化业务的发展,带来了对安全的挑战。本文从网络安全、业务安全、数据安全三个方面分享了BIGO安全的建设成果。一、网络安全对于一个企业来说,网络安全(CyberSecurity)层面的建设可主要分为三个方向:基础安全、安全体系、安全攻防。基础安全属于前期工作,是整个安全防御纵深体系的第一道墙。黑白盒扫描器、端口扫描器可以协助提前发现风险,避免有漏洞的应用被部署到外网,被守株待兔的黑客一击即中;WAF与抗DDoS系统等可用于实时防御,与黑客进行实时的对抗;SOC、SI...

2021-01-09 15:20:41 567

原创 BIGO技术 | 亿万模型参数的在线服务

一、背景推荐和广告领域已经大规模应用DNN模型,但大规模稀疏性仍然是该领域模型的本质特点,为了增强模型的拟合能力,模型稀疏参数会达到万亿规模,单模型的物理大小超过1TB,需要分布式的服务来承载;另外模型在线预估场景每秒的参数获取量由每秒用户请求量(大于1000),每个用户请求计算的item数量(大于1000),每个item获取的参数量(大于200)的三者乘积组成,其对应每秒的参数获取量KPS(Keys Per Second)在2亿的级别,即使用20个副本来分摊流量单机KPS也超过1000...

2021-01-09 14:43:47 2308 11

原创 BIGO技术 | 万亿模型参数的训练

​一、推荐场景特征稀疏性推荐场景通常由于引入了大量的ID类特征从而导致存在海量稀疏参数,例如下图经典YouTube DNN模型中,使用用户观看过的视频以及用户历史search tokens作为主要Embedded特征。根据论文中论述,YouTube DNN中candidate video以及search tokens均有百万之巨。在此基础上如果再使用交叉特征,就会使参数爆炸问题进一步加剧。图1 YouTube DNN在BIGO推荐场景主模型的稀疏参数也已经近万亿,即使按照FP16存储..

2021-01-06 18:06:59 897 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除