长视频优化：如何高效减少转码耗时

最新推荐文章于 2025-02-20 18:59:02 发布

码中之牛

最新推荐文章于 2025-02-20 18:59:02 发布

阅读量5.6k

点赞数 2

分类专栏： Android 移动开发音视频文章标签： android 音视频经验分享 android studio

本文链接：https://blog.csdn.net/weixin_61845324/article/details/124248947

版权

本文来自微信客户端技术团队，作者：瑞澈。

1.背景介绍

在视频号项目中，允许用户上传一分钟内的编辑视频，或者选择30min内的长视频。目前来看，整个发表（视频转码+上传）的耗时还略显偏久，虽然当下转码过程都是在手机后台运行，不会阻塞用户交互，但是由于视频未发表成功，视频点赞和转发功能都被限制，对用户和业务而言，这都是很不好的体验，有值得优化的必要。

1.1分析：耗时来源

整个耗时 = 视频转码耗时 + 上传耗时目前上传的时间取决于用户网络，这个不是本文讨论的重点，先暂时不予考虑。那么为什么我们需要对视频进行转码呢？

对于用户主动编辑的视频，我们需要重新处理视频才能满足需求。
考虑到网络带宽影响和用户观看端体验的优化（网速一定时，文件越大，下载的耗时等比增加），我们需要对视频做一些压缩处理，利于首次快速播放。
现在的手机屏幕普遍的分辨率是2k左右，让用户去加载4k的视频，是一种资源浪费。在尽量保证视频效果的同时，同时减小视频的体积，可以降低带宽和手机性能压力（编解码播放）。
如果用户的视频自身已经满足一般的播放条件，且又未编辑，此时我们会选择直接上传文件（前置MOOV结构，满足边下边播需求），降低二次转码对视频清晰度带来的损耗。

1.2 当前方案

在实现功能的前提下，在视频号发表侧我们选择了不同于其他场景的处理方式，用户编辑完成点击发表视频后，我们选择将整个视频合成的逻辑放到手机后台执行，不阻塞用户的交互，从而优化用户体验。但是后台合成的耗时也不可小觑，当发表成功后，用户才可以执行点赞、分享等操作。长时间的等待，会降低用户对当前视频的关注度，降低这里的耗时，可以降低用户的等待时间，为活跃视频号分享有重大的意义。

1.3 当前业界主流方案

在满足一定限制条件（分辨率、码率和帧率）且未编辑的视频，允许直接上传后台；超过限制条件或者存在编辑的情况，则客户端转码后上传后台，后台再将视频转码成多路视频，按照策略向客户端下发。和我们当前的方案基本无异。

关于转码速度优化，目前主流的优化的方案，都是采用硬件编解码为主，优化渲染速度或者优化编解码的调用方式（MediaCodec 异步模式），通过降低每个流程的耗时，来优化时间。在一定程度上来说，这种优化方式是存在**“天花板”**的，每个流程是客观存在耗时的，在无多余等待或者操作耗时的时候，优化就到了尽头。

1.4 拓展方案和技术可行性分析

作为有理想的开发，我们是不会止步于此的。抽象一下问题，我们在深入思考类推一下：对于普通的耗时任务而言，我们通常选取的优化手段是，判断任务是否有时间强相关性，否则可以通过多线程并行的方式来缩短耗时。这个思想在目前操作系统（多线程）和硬件（多核CPU）都得到了体现。那我们的任务是什么呢？主要耗时又在哪里？任务相关性几何？任务是将长视频进行转码。细分一下模块，主要包括：视频转码和音频转码。相较于音频编码，视频编码存在更高的复杂度和数据量，所以主要耗时在视频转码。一个普通的mp4文件，一般由多个轨道组成；最为常见的例子，也就是如下图所示的普通视频，包含一个音轨和一个视轨。

视频轨道

任务时间相关性呢？

视轨和音轨是相互独立的，彼此之间无相关性。在当前方案下，音轨和视轨是同时进行转码的，并且主要的耗时集中在视频转码之上，以此可以减少音轨转码带来的耗时。接着在来详细分析一下视轨，视轨可以认为就是带有一组连续时间戳的静态图像压缩帧，这些帧按类型分为IPB帧；I帧可以独立解码，P帧和B帧需要依赖其他帧才能完成解码；GOP就是两个I帧之间的间隔。

GOP 图示说明