阿里云国际版全产品介绍（媒体服务）_阿里云流媒体服务-CSDN博客

本文链接：https://blog.csdn.net/zzy4179/article/details/139988037

阿里云国际版媒体服务产品目录

（一）视频点播
（二）视频直播
（三）媒体处理
（四）音视频终端SDK

（一）视频点播

阿里云视频点播（ApsaraVideo VOD）是集音视频采集、编辑、上传、自动化转码处理、媒体资源管理、高效云剪辑处理、分发加速、视频播放于一体的一站式音视频点播解决方案。

阿里云视频点播基于阿里云强大的基础设施服务，面向视频网站、短视频、在线教育、娱乐社交、新闻传媒等行业，提供端-云-端的视频全链路功能，支持客户针对视频内容的生产、存储、转码、媒资、分发的一站式服务。

产品架构 在这里插入图片描述
架构简要说明：
用户可以通过控制台、API、SDK等多种方式将视频上传到点播平台。
用户可以按需对视频进行基础处理、特效处理和加密处理等操作。
用户可将处理后的视频分发到各种平台，方便客户更好的体验视频服务。

1.1 采集上传

视频点播支持多种方式上传多种格式的媒体文件，支持多端上传、并发上传、断点续传、短视频SDK直接上传等能力，可满足不同场景下的上传需求。

媒体多方式上传

支持的上传方式
1.控制台上传
2.SDK上传
3.服务端（JAVA等多种语言）上传
4.客户端上传：Web端（JavaScript）、移动端（Android，iOS）
5.离线拉取上传
6.PC客户端工具上传
7.直播录制转点播
支持的上传格式

短视频SDK录制上传

通过短视频SDK在端侧直接拍摄或导入视频，经编辑处理后可以上传到视频点播中。短视频SDK支持多种分辨率选择、实时美颜、实时滤镜、摄像头切换、闪光灯切换、对接人脸识别SDK实现人脸贴图等多样的录制功能，支持视频画面和时长裁剪、多视频拼接、添加滤镜、动图、音乐、MV、字幕、涂鸦等短视频高级编辑功能。提供产品级的UI开源界面，方便您根据业务需求定制界面，提供易用、稳定、统一的视频录制、导入裁剪和编辑高级接口，实现真正的二次开发，做到真正个性化。

1.2 媒体管理和生产

视频点播支持对上传后的视频进行管理和剪辑。

1.2.1 媒资管理

媒资存储：媒资存储数据多重冗余备份，提供异地容灾和资源隔离，提供 99.999999999（11个9）% 的数据可靠性，您可以在任何应用、任何时间、任何地点存储和访问您的数据。

媒资管理：支持通过控制台或 API 对媒资进行管理，包括获取媒资信息、更新媒资信息、搜索媒资信息、下载媒体文件和删除媒体文件的媒资管理功能。

视频版权保护：用来唯一标记一个视频，实现对视频中的图像、音频等指纹特征的提取和比对，解决重复视频查找、视频片段查源、原创识别等问题。

媒体智能审核：提供支持视频、音频、图片、文本等全方位的媒体审核，包括智能审核、人工审核、以及安全审核配置等，通过自动化、智能审核媒资库资源，极大降低色情、暴恐、涉政等内容违规风险，降低人工审核成本。

1.2.2 媒体处理

音视频转码：提供丰富的转码处理功能，将一个音视频文件转换成另一个或多个音视频文件，以适应不同网络带宽、不同终端设备和不同的用户需求。

视频截图：在指定视频特定的位置进行图像截取，并生成图片文件。

视频动图：在指定视频中特定的一个区间进行内容截取，并生成动图文件。

视频水印：在视频的编解码过程中将图片、文字等信息压制到视频流中合并输出一个带图文水印的新的视频文件。

工作流：将媒体处理功能流程化、实例化，用户可提前构建自定义处理流程，并将指定视频按照特定工作流程进行处理，避免用户重复、繁琐的调用接口，提供一站式的媒体处理服务。

多码率自适应：将指定的音视频文件流统一打包生成一个自适应码流文件，让播放器可根据终端网络带宽环境自动选择最适合当前带宽环境的码流播放，从而提升播放体验。

1.2.3 智能生产

云剪辑：是视频点播的制作中心，支持剪切拼接、混音、字幕、图片叠加、遮标、转场特效等功能。

剪切合并：实现整段合成、保留片头剪切、保留片尾剪切、掐头去尾和多段视频截取任意区间合并等。
音频处理：实现音频处理的各种场景，如静音、混音、音频提取、音量调节、配音等。
图片叠加：实现全程叠加、指定区域叠加图片等，包括单视频叠加和多视频叠加。
文字叠加：实现全程叠加、指定区域叠加文字等。

媒体DNA：实现对视频中的图像、音频等指纹特征的提取和比对，解决重复视频查找、视频片段查源、原创识别等问题。

智能标签：通过分析视频中视觉、文字、语音、行为等信息，结合多模态信息融合及对齐技术，实现高准确率内容识别，自动输出视频的多维度内容标签，将非结构化信息转化为结构化信息。

智能封面：支持对视频内容进行分析和理解，提取最能代表视频内容的5张截图作为封面备选图；也支持将视频内容的关键画面进行抽取，自动合成作为动图封面。

1.2.4 视频加密

私有加密：将视频文件转成加密的HLS格式，通过阿里云播放器进行解密播放，保障移动端、FLASH端视频安全。安全级别高，适用于在线教育，付费观看等场景。

标准加密：将视频内容按照HLS AES-128标准协议进行加密，支持HLS规定的播放器均可播放、保障移动端视频安全。安全级别较高，终端兼容性好。

商业DRM：各平台（微软Playready、苹果Fairplay、谷歌Widevine等）原生支持，安全级别很高，满足大的版权内容提供商的要求。

1.3 分发播放

视频点播支持播放音频和视频文件，您可以通过控制台预览、集成阿里云播放器SDK和集成第三方播放器进行播放。

分发加速
视频点播依托于阿里云强大的CDN能力基础上，为您提供视频分发加速服务，实现更好的视频播放体验。

防盗链：基于HTTP协议支持的Referer机制，通过Referer跟踪来源，对来源进行识别和判断，您可以通过配置访问的Referer黑白名单来对访问者身份进行识别和过滤，从而限制视频点播中托管并分发的视频资源被访问的情况。

URL鉴权：通过阿里云CDN加速节点与您的资源站点配合实现的一种更为安全可靠的源站资源防盗方法，旨在保护您上传到视频点播的内容资源不被非法站点下载盗用。

播放鉴权：视频点播在阿里云AK安全认证基础上的二次鉴权机制。

音视频播放

阿里云播放器SDK是阿里云视频云，端到云到端服务的重要一环，除了支持点播和直播的基础播放功能外，深度融合视频云业务，如支持视频的加密播放、安全下载、清晰度切换、直播答题等业务场景，为您提供简单、快速、安全、稳定的视频播放服务。

统计分析

播放质量监控&运营统计：基于阿里云视频播放器的终端数据采集能力，针对播放质量提供数据大盘，例如：播放量、卡顿率、播放失败率等，并提供QoS（Quality of Service，服务质量）、QoE（Quality of Experience，体验质量）透视，及单点探查服务。同时提供更贴近运营场景的播放行为数据及热门资源统计。如：播放UV、播放VV、人均观看时长、热门视频等。

1.4 产品优势

视频点播依托于阿里云强大的内容分发网络和卓越的技术，让用户以更小成本体验到更安全、更快速、更灵活的视频内容服务。

全球极速分发网络
以全球3200+个CDN节点、180 Tbps带宽输出能力，覆盖70多个国家和地区、支持数十家运营商。依托阿里云强大的全球音视频通信网（GRTN），为企业提供更具性价比的极速网络。

广电级媒体处理
4K级高速并行转码系统，转码任务规模无缝扩展，提供视频截图、视频标签、视频水印等多种功能，满足广电、视频网站、短视频等场景需求。

全方位加密保障
访问限制、播放鉴权、视频加密（阿里云加密、HLS加密、DRM加密）、安全下载等多重安全保障，防止盗链、非法下载等造成的损失，保障视频内容安全。

自创的窄带高清
自研S265编码和窄带高清2.0技术，真正实现高画质低码率，边缘动态自适应码流，降本提效，打造丰富的视听体验。

全流程媒体服务
从视频生产上传、媒资管理、媒体处理、智能生产到分发播放一站式媒体服务，提供高扩展性的平台架构。

接入灵活成本低
控制台简单易用，丰富的SDK及开放API，支持弹性开发。计费价格和方式，灵活价优，大大降低运营成本。

精细的数据分析
视频生产到播放的全流程数据分析，多样的资源用量统计和贴近场景的播放运营分析，开发和运营决策数据化。

智能化视频审核
阿里卓越视频AI技术实现智能审核，准确识别色情、暴恐、涉政等敏感信息，人工审核二次验证，兼顾安全与效率。

1.5 应用场景

点播的应用场景包括但不限于音视频网站，短视频，在线教育，广电传媒。

说明
本文提供典型的场景说明，更详细的组网和场景，可访问视频点播产品详情页。

场景	描述	功能优势
短视频	视频点播适用于以短视频主营的服务场景或App，例如电商，母婴，社交等服务平台。	视频点播不仅提供视频上传、视频审核、视频转码、视频处理、视频分发等功能，还提供丰富的SDK，是一个完整的短视频平台解决方案。
音视频网站	视频点播适用于视频播放和管理的网站服务场景，例如新闻网站，视频网站。	视频点播不仅提供视频上传、视频转码、视频分发、视频播放等功能，还提供可定制和可扩展的音视频服务，可满足百万用户同时在线的吞吐能力。
在线教育	视频点播适用于课程点播、视频版权保护的教育服务场景，例如在线培训，在线教育。	视频点播不仅可以通过控制台/API等多种方式上传教学视频和转码能力保证流畅的体验，还提供防盗链、视频加密等版权保护方案保护教学内容不被窃取，全方位保障视频内容安全。
广电传媒	视频点播适用于有高清转码、在线剪辑及安全管理的视频服务场景，例如广播电视，新闻机构。	视频点播不仅提供视频存储、视频转发和在线剪辑等功能，还提供语音、文字、视觉等多维度精准识别，并对视频、封面、标题或评论的违禁内容进行AI智能审核与人工审核，保证内容的合规。

1.6 基本概念

为便于您更好的理解视频点播产品，您可以在使用前了解视频格式、视频编码、视频转码等基本概念。

文件格式
操作系统中的文件名都有后缀，即扩展名，例如1.doc，2.jpg，3.avi等。设置扩展名的目的是让系统中的应用程序来识别并关联这些文件，让相应的文件由相应的应用程序打开。常见的文件格式如1.avi，2.mpg，3.mp4这些都叫做视频的文件格式，可由电脑上安装的视频播放器关联和打开（播放）。

封装格式
封装格式（Format），也称多媒体容器（Multimedia Container），是将已编码压缩好的视频轨道、音频轨道和元数据（视频基本信息如标题、字幕等）按照一定的格式规范，打包放到一个文件中，形成特定文件格式的视频文件。

封装格式主要分为两大类：面向存储的和面向流媒体的。

面向存储的，常见的有AVI、ASF（WMA/WMV）、MP4、MKV、RMVB（RM/RA）等；
面向流媒体的，常见的有FLV、TS（需要配合流媒体网络传输协议，如HLS、RTMP等），MP4也支持流媒体方式（配合HTTP等）。

下面以流媒体传输协议的视角重点介绍面向流媒体的封装格式：

MP4：经典的视频封装格式，移动端（iOS、Android）、PC Web多终端都能良好支持。但MP4的视频文件头太大，结构复杂；如果视频较长（如数小时），则其文件头会过大，影响视频加载速度，故更适合短视频场景。
MP4由一个个的box（以前叫atom）组成，所有的Metadata（媒体描述元数据），包括定义媒体的排列和时间信息的数据都包含在这样的一些结构box中。Metadata 对媒体数据（比如视频帧）引用说明，而媒体数据在这些引用文件中的排列关系全部在第一个主文件中的metadata描述，这样就会导致视频时长越大文件头就会越大、加载越慢。
HLS（HTTP Live Streaming）：苹果公司推出的基于HTTP的流媒体网络传输协议，视频的默认封装格式是TS，除了多个TS分片文件，还定义了用来控制播放的m3u8索引文件（文本文件），可以规避普通MP4长时间缓冲头部数据的问题，比较适合点播场景。移动端（iOS、Android）支持较好，但PC端IE存在兼容性问题依赖播放器的二次开发（建议使用阿里云Web播放器）。
FLV：Adobe公司推出的标准，在PC端有Flash的强力支持，但在移动终端只有App实现播放器才能支持（建议使用阿里云播放器），大部分手机端浏览器（特别是苹果的移动设备）均不支持。
DASH（Dynamic Adaptive Streaming over HTTP）：使用fragmented MP4（fMP4）格式，将MP4视频分割为多个分片，每个分片可以存在不同的编码形式（如分辨率、码率等）；播放器端可自由选择需要播放的视频分片，实现自适应多码率、不同画质内容的无缝切换，提供更好的播放体验。其中MPD文件类似HLS的m3u8文件，国外视频网站如YouTube、Netflix等较多使用DASH。
HLS+fMP4（HTTP Live Streaming with fragmented MP4）：此处单列，但本质上还是HLS协议。苹果公司于WWDC 2016宣布新的HLS标准支持文件封装格式为fragmented MP4，使用方法与TS分片类似，意味着一次转码可同时打包成DASH和HLS。
HLS（包括HLS+fMP4）和DASH是最常用的自适应流媒体传输技术（Adaptive Video Streaming），推荐使用。

编码方式
视频编码方式（Codec）是指能够对数字视频进行压缩或解压缩（视频解码）的程序或者设备。通常这种压缩属于有损数据压缩。也可以指通过特定的压缩技术，将某个视频格式转换成另一种视频格式。常见的编码方式有：

H.26X系列：由ITU（国际电信联盟）主导，包括H.261、H.262、H.263、H.264、H.265。
- H.261：主要应用于老的视频会议和视频电话产品中。
- H.262：主要应用于广播、DVD、数字电视等领域，主要提供标清（SD）视频的编码和传输功能。
- H.263：主要应用于视频会议、视频电话和网络视频中。
- H.264：H.264/MPEG-4第十部分，或称AVC（Advanced Video Coding，高级视频编码），是一种视频压缩标准，一种被广泛使用的高精度视频的录制、压缩和发布格式。
- H.265：高效率视频编码（High Efficiency Video Coding，简称HEVC）是一种视频压缩标准，H.264/MPEG-4 AVC的继任者。HEVC不仅提升图像质量，同时也能达到H.264/MPEG-4 AVC两倍的压缩率（等同于同样画面质量下码率减少50%），可支持4K分辨率甚至超高画质电视，最高分辨率可达8192×4320（8K分辨率），这是目前发展的趋势。
MPEG系列：由ISO（国际标准化组织）下属的MPEG（动态图像专家组）主导，视频编码方面主要有：
- MPEG-1第二部分：主要使用在VCD上，有些在线视频也使用这种格式，该编解码器的质量大致上和原有的VHS录像带相当。
- MPEG-2第二部分：等同于H.262，使用在DVD、SVCD和大多数数字视频广播系统和有线分布系统（Cable Distribution Systems）中。
- MPEG-4第二部分：可以使用在网络传输、广播和媒体存储上，比起MPEG-2和第一版的H.263，它的压缩性能有所提高。
- MPEG-4第十部分：技术上和ITU-TH.264是相同的标准，二者合作，诞生了H.264/AVC标准，ITU-T将其命名为H.264，而ISO/IEC称它为MPEG-4高级视频编码（Advanced Video Coding，AVC）。
AVS（Audio Video coding Standard）：我国自主知识产权的信源编码标准，是《信息技术先进音视频编码》系列标准的简称，目前已完成两代AVS标准的制定。
- 第一代AVS标准包括国家标准《信息技术先进音视频编码第2部分：视频》（简称AVS1）和《信息技术先进音视频编码第16部分：广播电视视频》（简称AVS+）。AVS+的压缩效率与国际同类标准H.264/AVC最高档次（High Profile）相当。
- 第二代AVS标准，简称AVS2，首要应用目标是超高清晰度视频，支持超高分辨率（4K以上）、高动态范围视频的高效压缩。AVS2的压缩效率比上一代标准AVS+和H.264/AVC提高了一倍，超过国际同类型标准HEVC/H.265。
其他系列，如，VP8、VP9（Google 主导），RealVideo（RealNetworks推出）等编码方式，在互联网视频使用较少，此处不再介绍。

选择编码方式要充分考虑播放终端（如移动端APP、Web浏览器等）的兼容性，尽量使用最常见和广泛支持的。阿里云视频点播支持视频编码格式：H.264/AVC（默认）、 H.265/HEVC，音频编码格式：MP3（默认）、AAC、VORBIS、FLAC。

转码
视频转码（Video Transcoding）是指将已经压缩编码的视频码流转换成另一个视频码流，以适应不同的网络带宽、不同的终端处理能力和不同的用户需求。转码本质上是一个先解码、再编码的过程，因此转换前后的码流可能遵循相同的视频编码标准，也可能不遵循相同的视频编码标准。

转封装
转封装指的是将视频或音频的封装格式进行转换，如将AVI的视频转换为MP4，其间并不会进行音视频的编码和解码工作，而是直接将视频和音频压缩码流从一种封装格式文件中获取出来然后打包成另一种封装格式的文件。相比转码，转封装有两大特点：

处理速度极快。音视频编解码过程十分复杂，占据了转码的绝大部分时间。转封装不需要进行编码和解码，节约了大量的处理时间。
音视频质量无损。没有解码（解压缩）和编码（压缩）过程，所以不会有音视频的压缩损伤。

转封装后的文件与原始文件的分辨率、码率等几乎一致，故播放时也称其为“原画”。

码率、码流
码率（Bitrate）是指视频文件在单位时间内使用的数据流量，也叫码流或码流率，是视频编码中画面质量控制最重要的部分。量度单位为“比特每秒”（bit/s或bps），常使用Kbps（每秒多少千个比特）或Mbps。一般来说同样分辨率下，视频文件的码率越大，压缩比就越小，画面质量就越高。码率越大，说明单位时间内取样率越大，数据流精度就越高，处理出来的文件就越接近原始文件，图像质量越好，画质越清晰，要求播放设备的解码能力也越高。

当然，码率越大，文件体积也越大，其计算公式是文件体积=时间×码率/8。例如，网络上常见的一部60分钟的码率为1Mbps的720P的视频文件，其体积就大概为3600秒×1Mbps/8=450MB。

分辨率
分辨率（Resolution）用来描述视频对细节的分辨能力，通常表示为每一个方向上的像素数量，比如1280x720等。分辨率决定了视频画面细节的精细程度。通常情况下，视频的分辨率越高，所包含的像素就越多，画面就越清晰。

分辨率是决定码率的主要因素，不同的分辨率要采用不同的码率。总体而言，视频的分辨率越高，所要求的码率也越大，但并不总是如此，不同分辨率都有合理的码率选择范围。所谓“合理的范围”指的是，如果低于这个范围，视频画面质量会很差；如果高于这个范围，画面提升有限甚至几乎无提升，且浪费网络流量和存储空间。

帧率
帧率（Frame Rate）是单位时间内视频显示帧数的量度单位，也就是每秒钟刷新的图片的帧数，量度单位为“每秒显示帧数”（Frame Per Second，FPS）或“赫兹”。

高的帧率可以得到更流畅、更逼真的画面效果。一般来说25~30fps就可接受，提升至60fps则可以明显提升交互感和逼真感，但一般来说超过75fps就不容易察觉到有明显的流畅度提升了。如果帧率超过屏幕刷新率只会浪费图形处理的能力，因为显示设备不能以这么快的速度更新，这样超过刷新率的帧率就浪费掉了。在分辨率不变的情况下，帧率越高，则对显卡的处理能力要求越高。

GOP（关键帧间隔）
GOP（Group of Pictures）是一组以 MPEG 编码的影片或视讯串流内部的连续图像，以 I 帧开头，到下一个 I 帧结束。一个 GOP 包含如下图像类型：

I帧（Intra Coded Picture）：又称帧内编码帧，为关键帧，是一种自带全部信息的独立帧，无需参考其他图像便可独立进行解码，可以简单理解为一张静态画面。视频序列中的第一个帧始终都是I帧，每个GOP由I帧开始。
P帧（Predictive Coded Picture）：又称帧间预测编码帧，需要参考前面的I帧才能进行编码。表示的是当前帧画面与前一帧（前一帧可能是I帧也可能是P帧）的差别。解码时需要用之前缓存的画面叠加上本帧定义的差别，生成最终画面。与I帧相比，P帧通常占用更少的数据位，但不足是，由于P帧对前面的P和I参考帧有着复杂的依赖性，因此对传输错误非常敏感。
B帧（Bidirectionally Predictive Coded Pictures）：又称双向预测编码帧，也就是B帧记录的是本帧与前后帧的差别。也就是说要解码B帧，不仅要取得之前的缓存画面，还要解码之后的画面，通过前后画面的与本帧数据的叠加取得最终的画面。B帧压缩率高，但是对解码性能要求较高。

GOP值表示关键帧的间隔（即两个关键帧之间的帧数），也就是两个IDR帧之间的距离，一个帧组的最大帧数。一般而言，每一秒视频至少需要使用1个关键帧。增加关键帧个数可改善视频质量，但会同时增加带宽和网络负载。GOP值（帧数）除以帧率即为时间间隔，如阿里云视频点播默认的GOP值为250帧，帧率为25fps，则时间间隔为10秒。

GOP值需要控制在合理范围，以平衡视频质量、文件大小（网络带宽）和seek效果（拖动、快进的响应速度）等：

加大GOP值有利于减小视频文件大小，但也不宜设置过大，太大则会导致GOP后部帧的画面失真，影响视频质量。
GOP值也是影响视频seek响应速度的关键因素，seek时播放器需要定位到离指定位置最近的前一个关键帧，如果GOP太大意味着距离指定位置可能越远（需要解码的预测帧就越多）、seek响应的时间（缓冲时间）也越长。
由于P、B帧的复杂度大于I帧，GOP值过大，过多的P、B帧会影响编码效率，使编码效率降低。
但如果设置过小的GOP值，则需要提高视频的输出码率，以确保画面质量不会降低，故会增加网络带宽。

扫描模式

逐行扫描（progressive）：在电子显示屏上通过扫描显示图像时，每一帧图像通过一场扫描来完成，由电子束顺序地一行接着一行连续扫描而成，一场扫描即能构成完整的画面。
隔行扫描（interlaced）：在电子显示屏上通过扫描显示图像时，每一帧图像通过两场扫描来完成，通常第一场先只扫描奇数行，然后第二场只扫描偶数行，两场组合起来构成完整的画面。

IDR 帧对齐
IDR帧（Instantaneous Decoding Refresh Picture），即时解码刷新帧，是 I 帧的一种。与普通 I 帧的区别在于，一个 IDR 帧之后的所有帧都不能引用该 IDR 帧之前的帧的内容；相反，对于普通的 I 帧，其后的 P 帧和 B 帧可以引用该普通 I 帧之前的其他 I 帧。在编码和解码中为了方便，将首个I帧和其他I帧区别开，称为IDR，这样就方便控制编码和解码流程。

IDR帧的作用是立刻刷新，使错误不致传播，从IDR帧开始，重新算一个新的序列开始编码。而普通I帧不具有随机访问的能力，这个功能是由IDR承担。视频播放时，播放器一般都支持随机seek（拖动）到指定位置，而播放器直接选择到指定位置附近的 IDR 帧进行播放最为便捷，因为可以明确知道该 IDR 帧之后的所有帧都不会引用其之前的其他 I 帧，从而避免较为复杂的反向解析。

在对同一个视频进行多码率转码时，如果指定 IDR 帧对齐（IDR Frame Alignment），则意味着所有输出视频的 IDR 帧在时间点、帧内容方面都保持精确同步，此时播放器便可实现多码率视频平滑切换，从而不会出现较为明显的切换卡顿。

编码级别
编码档次（Profile）是针对特定应用场景的特定编码功能的集合。H.264 规定了三种主要级别：

Baseline：支持 I/P 帧，只支持无交错（Progressive）和 CAVLC，一般用于低阶或需要额外容错的应用，比如视频通话、手机视频等即时通信领域；
Main：提供 I/P/B 帧，支持无交错（Progressive）和交错（Interlaced），同样提供对于 CAVLC 和 CABAC 的支持，用于主流消费类电子产品规格如低解码（相对而言）的 MP4、便携的视频播放器、PSP 和 iPod 等；
High：在 Main 的基础上增加了 8x8 内部预测、自定义量化、无损视频编码和更多的 YUV 格式（如 4:4:4），用于广播及视频碟片存储（蓝光影片），高清电视的应用。

比特率
比特率（Bit rate）是指每秒传送的比特（bit）数，单位为bps(Bit Per Second)，比特率越高，传送的数据越大。在视频领域，比特率等同于码率。比特率表示经过编码（压缩）后的音、视频数据每秒钟需要用多少个比特来表示，而比特就是二进制里面最小的单位，要么是0，要么是1。与码率类似，比特率与音、视频压缩的关系，简单的说就是比特率越高，音、视频的质量就越好，但编码后的文件就越大；如果比特率越低则文件越小。

码率控制方法
码率控制是指视频编码中决定输出码率的过程，常用的码率控制方法有：

VBR（Variable Bitrate）：动态比特率，也就是没有固定的比特率，音视频压缩软件在压缩时根据音视频数据的复杂程度即时确定使用什么比特率，这是以质量为前提兼顾文件大小的方式。
CBR（Constant Bitrate）：固定比特率，指文件从头到尾都是一种位速率。相对于VBR和ABR来讲，它压缩出来的文件体积很大，而且视频质量相对于VBR和ABR不会有明显的提高。
ABR（Average Bitrate）：平均比特率，是VBR的一种插值参数。LAME针对CBR不佳的文件体积比和VBR生成文件大小不定的特点创造了这种编码模式。ABR在指定的文件大小内，以每50帧（30帧约1秒）为一段，低频和不敏感频率使用相对低的流量，高频和大动态表现时使用高流量，可以做为VBR和CBR的一种折衷选择。
ABR在一定的时间范围内达到设定的码率，但是局部码率峰值可以超过设定的码率，平均码率恒定。ABR是VBR的改良版，能确保输出平均码率在合理范围，且在这个范围内，还是动态根据复杂度编码，也是阿里云默认的编码控制方式。

编码格式
定义参考视频编码方式。主要包括无损编码和有损编码两种。根据采样定理，音频编码只能“无限接近”自然信号，故而所有的音频编码方式实质上都是有损的。在计算机领域中，通常约定能够达到最高保真水平的PCM编码为无损编码。互联网中常见的音频编码均为有损编码，常见的编码格式有MP3、AAC等。

采样率
采样率（Sample Rate），也称为采样速度或者采样频率，定义了每秒从连续信号中提取并组成离散信号的采样个数，单位为赫兹（HZ）。采样率是指将模拟信号转换成数字信号时的采样频率，也就是单位时间内采样多少点，采样频率越高声音的还原就越真实越自然。

声道、声道数
声道（Sound Channel）是指声音在录制（或播放）时，在不同空间位置采集（或播放）的相互独立的音频信号。所谓声道数，也就是声音录制时的音源数量或播放时的扬声器数量。

UTC时间（ISO 8601标准时间格式）
UTC时间指的是协调世界时，又称世界统一时间、世界标准时间、国际协调时间。由于英文（CUT）和法文（TUC）的缩写不同，作为妥协，简称UTC。协调世界时是以原子时秒长为基础，在时刻上尽量接近于世界时的一种时间计量系统。中国内地采用ISO 8601-1988的《数据元和交换格式信息交换日期和时间表示法》（GB/T 7408-1994）称之为国际协调时间。

如无特别指定，阿里云视频点播默认返回的时间字段或接口请求的时间参数都为UTC时间，时间格式按照ISO8601标准表示，格式为：YYYY-MM-DDThh:mm:ssZ。例如：2017-01-11T12:00:00Z 表示北京时间2017年1月11日20点0分0秒。注：北京时间与UTC的时差为+8，也就是UTC+8。

1.7 使用限制

本文介绍了点播服务对资源使用、API的调用次数等的默认限制。

资源类型	使用限制	限制场景
域名	单用户不超过20个，域名必须已备案完成。	在控制台添加加速域名限制。
刷新预热缓存	每日刷新URL上限2000，刷新目录上限100，预热URL上限500（预热不支持目录）。	在控制台刷新预热限制。
存储	系统bucket单地域不超过1个	在控制台管理存储Bucket限制。
分类	单用户最多支持三级分类，每级分类最多支持100个子分类。	在控制台媒资分类限制。
自定义标签	单视频不超过16个。	在控制台媒资管理限制。
工作流	单用户不超过20个。	暂无
转码模板组	单用户不超过20个。	在控制台配置普通转码模板限制。
审核、剪辑、截图模板	单用户不超过20个。	在控制台配置普通转码模板限制。
转码模板组关联的模板数	单模板组不超过20个。	在控制台配置普通转码模板限制。
水印	单用户不超过20个。	在控制台水印管理限制。
模板关联的水印数	单模板不超过5个。	在控制台配置普通转码模板限制。
云剪辑	只能编辑相同存储地域的媒体文件。	在控制台云剪辑限制。
事件回调	单用户每个服务地域内不超过1个。	在控制台回调设置限制。
带宽	若您所属的某域名计费模式为流量计费或带宽计费，则在1分钟内的突增带宽不超过10 Gbps。	暂无

服务端接口访问限制
点播服务端接口默认有访问的频次限制，如超过访问次数会拒绝访问。

超过阈值会随机拒绝访问，返回的HTTP状态码为400，错误码：Throttling.User，错误信息：Request was denied due to user flow control.

API维度限制
视频点播针对单用户调用具体接口的频率有限制，即单用户调用频率（QPS限制）。调用接口超过单用户QPS限制会被限流，各接口的QPS限制，请参见API QPS限制。

IP维度限制
单IP默认访问限制：300次/秒，请注意是以互联网出口IP为准。

（二）视频直播

视频直播服务（ApsaraVideo Live）是基于前瞻的内容接入、分发网络和大规模分布式实时转码技术打造的音视频直播平台，提供便捷接入、高清流畅、超低延时、高并发的音视频直播服务。

产品架构
阿里云视频直播在服务端主要提供直播流接入、分发、实时流媒体处理服务。
在这里插入图片描述

主播通过采集设备采集直播内容后，通过推流SDK推送直播流，视频直播服务通过边缘推流的方式将直播流推送至阿里云直播中心，推送的视频流通过CDN边缘节点进行加速保证上行传输的稳定性。
视频流推送至阿里云直播中心后，可按需对视频流进行转码、时移、录制、截图等处理。
处理好的视频流通过CDN内容分发网络，下发至观众的设备中进行播放。移动端的播放设备可以集成阿里云提供的播放器SDK进行开发。
直播视频除了可以进行转码截图等操作外，还可以进行直播转点播的操作，将录制下来的视频转至点播系统中再进行点播播放和短视频云剪辑。方便直播与短视频内容生产和传播的联动。

功能说明
根据业务中不同直播场景的需求，视频直播除了提供标准直播外，还提供超低延时直播RTS服务。标准直播和超低延时直播RTS使用场景区别如下：

功能项	使用场景
标准直播	弱互动场景：以观众观看为主，且允许多用户画面由于网络差异导致画面不同步现象。
超低延时直播RTS	1.强互动场景：常用于电商直播、群直播、教育直播、企业直播等，低延时和强互动的特性有助于提升商业转化率和用户参与度。2.多用户画面一致场景：常用于赛事直播，让观众实时了解赛事现场情况，避免观众间画面不同步的现象。

同时，视频直播还提供转码、录制、时移、截图、审核等媒体处理功能和其它业务场景功能（包含云导播、美颜特效等）

功能特性
视频直播提供直播采集、边缘推流等主要功能的服务，其中主要包括直播推流、直播播流、直播安全、直播管理、数据统计、控制台管理、API管理和SDK支持八大类服务。

（三）媒体处理

媒体处理MPS（ApsaraVideo Media Processing，原MTS）是一种多媒体数据处理服务。以经济、弹性和高可扩展的转换方法，将多媒体数据转码成适合在全平台播放的格式。

产品架构
架构图
在这里插入图片描述
架构说明

媒体处理MPS基于阿里云云计算服务构建，改变了以往进行转码时需要购买、搭建、管理转码软硬件的高昂投入以及配置优化、转码参数适配等复杂性问题，借助云计算服务的弹性伸缩特性，可以按需提供转码能力，从而最大限度的满足业务转码需求，避免资源浪费。
媒体处理服务功能包括管理控制台、服务端API和软件开发工具包。您可以通过他们管理、使用媒体处理服务，也可以将媒体处理服务的相关功能集成到您自己的应用和服务中。

（四）音视频终端SDK

音视频终端SDK（MediaBox SDKs，后续统称“MediaBox音视频SDK”）集成了直播推流、视频播放、短视频创作、美颜特效、音频特效等核心能力为您提供一体化SDK，支持移动端、桌面端、Web端等多终端接入，搭配开源UI组件和产品级Demo，您可以根据业务需求集成对应SDK或采用低代码方式快速搭建所需应用。

产品架构
MediaBox音视频SDK是阿里云推出的音视频一体化产品，覆盖直播、点播业务中的拍摄、编辑、上传、推流到播放等核心环节，同时融合端侧增强、美颜特效等音视频AI能力。针对主流的音视频场景，MediaBox音视频SDK提供产品级Demo、低代码快速集成工具AUI Kits，支持广泛的音视频业务场景，可按需提供高效的集成方案。
在这里插入图片描述
功能特性
MediaBox音视频SDK提供直播推流、直播连麦、短视频、播放器、美颜特效五类服务。MediaBox音视频SDK及子产品的功能概览如下所示。其中，✔️和❌分别表示支持和不支持该功能。

您可以根据实际需求选择相应的SDK或其组合，各场景详细组合方式说明及SDK选择，请参见按场景下载。建议您使用MediaBox音视频SDK全功能版本，可有效解决单独集成多款SDK时引起的依赖库冲突问题。