快手智能视频图像编码处理服务架构

本文介绍了快手的多媒体算法服务Atlas,包括其诞生背景、能力简介、架构以及核心能力——视频编解码的挑战与实践。Atlas在快手短视频转码中发挥了重要作用,通过自研K系列编码器实现高效压缩,降低文件大小,提升了用户体验。此外,还分享了基于内容的处理与编码(CAPE)和AI视频增强的实际应用案例。
摘要由CSDN通过智能技术生成


正文字数:9639  阅读时长:14分钟

本文来自于快手视频算法工程师团队负责人闻兴在LiveVideoStackCon2020北京站上的精彩分享。凭借本主题演讲,闻兴老师荣获此次大会评选的优秀讲师称号。

文 / 闻兴

文章整理 / LiveVideoStack

在视频服务飞速发展的今天,视频平台如何在兼顾机器带宽成本的同时,让用户获得更加极致的观看体验,是每一个视频技术团队都会面临的问题。

复杂的技术从计划、研发、调试直到最终全量上线需要大量的线上测试及用户反馈,这一过程耗时长久,甚至可以说永无止境。很多时候,一些技术开发出来后,因为复杂度过高或者与实际场景差别过大,最终无法上线为用户提供更好的体验。所以在技术的开发及落地中,唯一的衡量标准——是能否在真实场景中以更低的成本为用户带来更好的体验

本文中所援引皆为已经在线上稳定运行的算法及服务,所有展示的数据均是线上实际业务中所产生的真实结果。希望本文分享的信息能够给更多开发者带来价值,也希望我们完成的这些工作能够对大家未来的技术研发工作有所启发。

本文将分为四个部分展开:首先,我们简单回顾短视频行业的发展历程并简要介绍快手;其次,重点介绍快手用于分析/处理/推理/转码的多媒体算法引擎——Atlas;再次,深入介绍Atlas的基础能力之一视频图像编解码能力,这也是快手首次对外公开介绍短视频转码系统和技术;最后,我们通过两个实际的应用项目,即基于视频内容的处理及分析(CAPE)以及视频的AI智能增强,来进一步介绍Atlas的落地和使用场景。

1

短视频行业及快手公司介绍

在过去几年中,随着移动互联网覆盖逐步饱和,我国互联网的用户整体规模增幅一直呈下降趋势,但毋庸置疑短视频行业已逐渐发展成为当下最火爆的市场之一。从2019年的数据可以看到,中国短视频用户月活达8.2亿,今年受疫情等因素影响,月活已接近9亿。另外,短视频应用使用时长的增长在行业内也占据首位。

快手作为一个国民短视频社区,拥有海量的用户和短视频内容,日活用户规模超过3亿,日播放量达到百亿级。每日产出UGC内容1500万,原创短视频库达到260亿。海量短视频下多媒体内容处理的成本与体验之间的平衡,不断为我们带来了新的挑战和新的惊喜。

2

多媒体算法服务架构平台:Atlas

以下将详细介绍快手的多媒体算法服务架构平台Atlas。

2.1 为什么要做Atlas?

在进行多媒体算法开发的时候,业务方的需求一般主要集中于三个方面:场景、体验和成本

场景需求角度来说,在实际应用中存在大量且需求迥异的业务场景,比如短视频场景对清晰度和流畅度都有很高的要求,长视频场景则更在乎内容的清晰度和沉浸感,而直播场景相对而言对流畅度的要求会更高一点,并且需要保证实时性,对延迟比较敏感。多样化的场景会提出多种截然不同的优化目标。

体验需求而言,难点在于部分业务方对体验的要求及预期无法量化,主观、感性表述往往较多,不能直接指导算法优化方向,因此专业的算法方案,需要同时兼顾客户的理解力和使用门槛。另一部分业务方的需求则更加具体及专业,有的业务方既需要传统算法,又希望能够利用神经网络推理能力;有的业务方既要做到尽量可控,又希望能有部分傻瓜模式以降低使用难度。

成本需求主要包含两方面,一是机器成本,业务方永远希望用最少的成本达到最优的体验;二是部署及维护成本,希望算法和工程的迭代及优化效率足够高,既要满足层出不穷的新需求又要尽量不新增更多的人力投入。

如何能更高效地满足这些需求?我们开始思考这个问题的解法,这就是快手建立多媒体算法服务端引擎Atlas的初衷。

(Atlas --- 阿特拉斯本是希腊神话旧神系中代表耐力、力量和天文的泰坦神,他被宙斯降罪放逐在大地之西,用双肩擎起整个天空(Uranus或指宇宙);而在欧洲古典主义的建筑风格中通常会用这类男性形象放在立柱的位置,这种结构也被称为Atlas。因此,我们为这个核心引擎取名Atlas,也寓意着快手希望在用户和开发者之间、需求和算法之间、算法和硬件结构之间能够搭起一座座桥梁,起到连接支撑的结构性作用。)

2.2 Atlas 能力简介

Atlas作为多媒体处理算法引擎,已经在快手的各种线上服务全面落地,包括快手主站及海外的视频/图像分析、视频/图像处理、视频转码等。与此同时,它也支撑了视频剪辑和视频制作工具“快影”企业级视频智能生产云平台“OnVideo”,以及其它新业务的大量视频分析、处理和制作需求。

Atlas现有的能力主要包括如下四个方向:视频图像压缩画质增强音频处理,以及智能生产

在快手每天会新增千万级的视频内容,这些视频的服务端转码任务都是通过Atlas来完成的。在视频图像压缩方面,我们一直在追求这一基本能力做到精益求精,从而达到为客户节约成本,为用户提供最优体验的目的。通过自研的K系列编码器 (K264/K265/KVC),Atlas展现了对于视频及图像的极致压缩能力。我们会在本文中后面的部分详细介绍快手的短视频编解码架构,作为其中核心的K系列编码器,以及上

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值