【搬运】HDR in Mind

来源:Elecard
作者:Alexander Kruglov
原文链接:https://www.elecard.com/page/article_hdr
内容整理:胡经川
本文主要讨论 SDR 和 HDR 之间的区别,并介绍主要的 HDR 标准,以及它们对 H.264/AVC、H.265/HEVC、VP9 和 AV1 的识别和验证。

尽管 SDR(标准动态范围)存在诸多弊端和过时的技术流程,但 SDR 格式的视频内容在当今媒体市场中仍处于主导地位, 而 HDR(高动态范围)格式才刚刚开始扩展。在本文中,主要介绍了每种 HDR 格式的最相关信息。所描述的标记使您可以快速深入到 HDR 领域,识别、整合 HDR 内容并解决可能出现的问题。

1、HDR 和 SDR 之间的区别

1.1 色彩参数

SDR 格式是基于Rec.ITU-R BT.709中描述的色度参数。它只覆盖了CEI 1931系统中人眼可见光谱的35.9%(如下图)。相比之下,HDR使用色彩参数Rec.ITU-R BT.2020则覆盖了75.8%的光谱。

1.2 色彩深度

SDR 的颜色深度为 8 bits。 虽然 SDR 并不禁止使用 10 bits,但实际上绝大多数视频内容都以 8 bits 色彩深度进行压缩。这意味着每种原色(R/G/B)可以有 256 个值,即总数为 256x256x256 = 16,777,216 种颜色。这是一个很大的数字,但人眼看到的更多,因此,在实践中,人眼还是很明显能区分 SDR 视频中的混叠过渡(如下图), 这在渐变背景场景中尤为明显,例如天空。

HDR 中的最小色深为 10 bits, 既每种原色有 1024 个可能的值,总共 1,073,741,824 种颜色,是 SDR 的 64 倍。这样的图像更接近现实,但是,在某些情况下,人眼仍然能够注意到颜色过渡中的混叠。

1.3 亮度

人眼的构造除了颜色分量外,它还区分亮度分量,而且后者能被更强烈地感知。亮度单位为坎德拉/平方米(cd/m²)SDR 的亮度限制为 100 cd/m²,而 HDR 标准理论上可达到 10,000 cd/m² 。

现实生活中,中等价位的支持 HDR 的显示器声称亮度为 1,000 cd/m²,而更高价位的则可以提供高达 4,000 cd/m² 的亮度,但仅能在短时间内适用于某些场景。

2、理解HDR的一些基本概念

目前已推出的HDR技术标准以杜比视觉(Dolby Vision)、HDR 10、HLG为主流。EOTF(光电转换函数)是HDR技术标准中的关键技术,主要分为两种PQ(perceptual quantizer)和HLG(Hybrid Log-Gamma),前者由杜比公司研制推出,后者由NHK和BBC联合制定推出。

那么对于HDR为什么要设定新的EOTF而不沿用SDR的设定呢?

目前大部分SDR显示器峰值显示亮度在100 nits左右,其EOTF采用的是gamma曲线,而HDR需要能够显示10000 nits的峰值亮度,如果继续采用SDR的EOTF那么需要14 bits位深的像素来编码,这对于传输和存储都极为不利,好在人眼对于高亮度区域不如暗处敏感,利用这个特点,通过模拟人眼的生理特性提出的新的EOTF可以在不引入任何伪影的情况下用10bit或12 bit的像素来编码HDR内容。PQ曲线就是以此为基础提出的。

而HLG主要是基于如何使HDR内容与目前广泛运用的广播基础设施及SDR内容兼容而提出的。所以HLG曲线在低动态范围时与SDR的gamma曲线一致,同时根据韦伯定律对高动态范围的曲线重新进行了定义,从而完成对HDR和SDR内容的兼容。

色彩值(color value)

色彩值是用于描述一张图像中特定颜色分量(如R、G、B或Y)的数值。

数字编码值(digital code value)

一张图像信号值的数字表示,通常是非线性的颜色值。

电光转换函数(EOTF)

用于描述输入显示器的非线性颜色值(数字编码像素值)和显示器所显示的线性颜色值之间的关系。

光电转换函数(OETF)

用于描述线性颜色值与非线性颜色值(数字编码像素值)之间的关系。

光光转换函数(OOTF)

用于描述相机捕获光线值与显示器所显示光线强度之间的关系。

高动态范围(HDR)

图像或显示设备可以存储或显示的亮度等级范围要远大于传统成像系统。在SMPTE 2084标准中设定峰值亮度为10000 nits。

线性颜色值(Linear Color Value)

缩写记为L,归一化到[0, 1],与显示设备的输出光线强度成正比,但不与图像信号的编码值成正比。

非线性值(Nonlinear Color Value)

缩写记为N,归一化到[0, 1],与图像信号的编码值成正比,但不予显示设备的输出光强度成正比。

电视信号链(Television signal chain)

描述从相机的信号采集到显示器显示的整个过程,包括相机和显示器两部分的非线性变化。相机采集部分的非线性化由OETF描述,显示器显示部分非线性化由EOTF描述。

元数据(metadata)

内嵌在HDR信号中对信号接收显示器提供关于分级显示的参数信息的一组数据,从而在不同显示器上对同一图像提供最佳的显示效果。

PQ曲线

PQ由杜比公司研发制定,并由SMPTE组织在SMPTE ST 20843公布,是适应于HDR(亮度等级高于10000cd/m^2,并且色域适用于BT.2020标准)显示器的电光转换函数(EOTF)。它被Ultra HD Forum写进了UHD Phase A中,也被ITU写进了Rec.2010中。同时PQ被应用于第一个HDR标准Dolby Vision,和HDR 10中(HDR 10 是Dolby Vision的简化版主要差异体现在元数据方面)。

图 PQ的EOTF函数图像

HLG曲线

HLG(Hybrid Log-Gamma),是由BBC和NHK联合提出高动态范围标准,它分段定义了转换函数,不收取专利费用, 已经写入 ATSC 3.0, Digital Video Broadcasting (DVB) UHD-1 Phase 2和BT.2100,已经被youtube,BBC iplayer,Freeview等播放设备支持。

HLG可以让电视广播信号同时兼容HDR与非HDR的电视。其信号中不包含元数据,可以与目前广播电视的传输设备与显示设备相兼容,同时由于不收取专利费用,更有利于HDR技术在有线、无线与卫星电视领域进行推广和传播。与PQ不同,HLG技术会分别对信号中的高光和低光部分进行编解码,其中低光部分采用与SDR相同的标准伽马曲线,高光部分则基于韦伯定律使用对数曲线,从而使画面起到高动态范围的效果。

现代相机能够捕获的动态范围相比较于由传统gamma曲线能表达的动态范围要大很多。为了尽量利用整个动态范围,传统的相机采用被称为‘knee’的特征来扩展信号的动态范围。所谓‘knee’特征就是压缩图像高光区域以防止信号的“溢出”和过曝。HLG在高光区域也进行了压缩,但与‘knee’不同。

动态、静态元数据的对比

首先我们需要了解,元数据存在于基于PQ的HDR格式中,如Dolby Vision和HDR 10,而基于HLG的HDR不需要元数据。

这是因为PQ标准是一个绝对标准,意味着每个输入数据电平都有绝对输出亮度值,不存在变化,除非改变伽马曲线(EOTF)。当电视机的峰值亮度被校准后(一般SDR显示器为100nits),由于PQ的绝对性,无法增加显示器的光输出,如表4.1和图4.3所示;而HLG是以一个相对标准,把输入信号的75%定义为白(diffuse white),可以按照与传统SDR电视完全相同的方式进行缩放,此外,还包括基于亮度的系统伽玛变量,特别针对环境照明问题。

所以,当HDR被引入时,由于没有电视可以匹配主控/分级显示器(制作原视频的显示器)的峰值亮度和色域覆盖率,特别是峰值亮度。由于基于PQ的HDR的“绝对性”与主控显示无关,所以它们的峰值亮度不一样(不同显示器的峰值亮度都不一样)。为了试图克服这个问题,便引入了元数据以允许HDR电视重新映射(色调映射或逆色调映射)图像内容。

 表:峰值亮度为1000 nits的显示器对基于PQ输入数据的显示亮度值

图:10bit PQ亮度等级与编码值对应关系

PQ元数据有两种形式——静态和动态。

静态和动态元数据都包括显示RGB色度坐标的母带,白点色度和最小/最大亮度;它还包括最大帧平均光级(MaxFALL),其定义最亮的帧;以及最大内容光级(MaxCLL),其定义最亮的像素。

静态元数据在使用数据的所有时间内使用相同的值,而动态元数据会根据需要进行更改(可能会逐帧进行)。 HDR10使用静态元数据;而Dolby Vision和HDR10 +使用动态。

具体例子可见下图,静态元数据只能对某一场景如最亮的场重新映射,而动态元数据可以分别对不同场景进行不同的映射。

上图: 静态元数据的映射(只针对了过亮场景的映射) 

 上图:动态元数据的映射(针对不同场景有不同的映射)

3、HDR 标准

应该注意的是,HDR 是一个总称,市场上有来自不同供应商的多种 HDR 实现标准。使用最广泛的是四种 HDR 标准:HDR10、HLG、HDR10+ 和杜比视界(Dolby Vision)。下图显示了支持 HDR 的电视制造商的品牌以及当前支持 HDR 的流媒体服务。

要体验 HDR 内容,需要符合标准的 HDR 内容,以及支持 HDR 的解码器和显示器。

3.1 HDR10

HDR10 标准于 2014 年被采用。HDR10 由于其易用性和免许可费而获得广泛的接受。该标准描述了符合 UHDTV Rec.ITU-R BT.2020 标准建议的视频内容。 

HDR10 基于 PQ EOTF 传输函数,这也是此类视频内容与 SDR 显示器不兼容的原因。此外,HDR10 具有单层视频内容。

该标准应用于整个视频序列的静态元数据。一方面,静态实现简化了实现。同时,没有考虑到静态和动态、明暗场景需要不同色调的需求,因此需要应用全局补偿方法。因此,HDR10 无法完全将视频内容展现的淋漓尽致。

HDR10 元数据包括 MDCV(Master Display Color Volume) 和内容亮度级别信息。MDCV 描述了制作视频母版的显示器的基色坐标以及动态范围,是用于创建视频内容的显示参数,被认为是参考参数。播放视频内容时,将根据参考重新调整显示。

MDCV 描述包括:

  • Display_primaries:三个主要色度分量的X和Y坐标;

  • White_point:白点的X和Y坐标;

  • Max_display_mastering_luminance: 母版显示的标称最大亮度,单位为0.0001 ;

  • Min_display_mastering_luminance,母版显示的标称最小亮度,单位为 0.0001 。

内容亮度级别信息—图像标称目标亮度级别的上限值。它包括:

  • Content light level information(MaxCLL),表示最大像素亮度级别的上限,单位为 ;

  • Max_pic_average_light_level (MaxFALL),指定整帧最大平均亮度级别的上限,单位为。

在 H.264/AVC 和 H.265/HEVC 视频格式中,可以在两个级别指定 HDR10 元数据。

  1. 在基本视频流级别上指定 IDR 块的相应 SEI 标头上指定。下图显示了 HEVC 视频序列的 SEI MDCV 和内容亮度级别信息示例:最大标称亮度 1,000 ,最小标称亮度 0.05 ,MaxCLL 1,000 ,MaxCLL 400 , 以及色度分量和白点的坐标。

  2. 在 MP4 或 MKV/WebM 媒体容器级别上指定

VP9 在媒体容器级别指定数据,而 AV1 也可以在两个级别指定 HDR10 元数据。

3.2 HLG

HLG标准出现于2015年,也被广泛采用。该标准描述了符合 BT.2020 的视频内容。

HLG 与 HDR10 一样,承载了一层视频内容。与 HDR10 不同,HLG 没有元数据,因为它使用 HLG EOTF 混合对数函数,一部分重复 SDR 函数曲线。这样的实现理论上允许在 PQ EOTF(HDR10、HDR10+、杜比视界)和 SDR 显示器上播放 HLG,色度参数符合 BT.2020。就写实程度而言,HLG 和HDR10 一样,也无法完全将视频内容展现的淋漓尽致。由于 HLG EOTF 函数的特殊性,如果图像包含饱和色彩的明亮区域,则 SDR 显示器上的色调变化可能会很明显。通常,在具有镜面光斑的场景中会观察到失真。

图5:相对于 SDR 和 PQ HDR 的 HLG 曲线

HLG 视频流可以通过 Transfer_characteristics 参数标识,该参数的值为 14 或 18。对于 H.264/AVC 和 H.265/HEVC,可以指定参数:

  • 在 MP4 媒体容器级别:在 avcc、hvcc 或 colr box中;

  • 在相应的 TrackEntry 视频和颜色框中的 MKV/WebM 媒体容器级别;

  • 在基本流级别上的 SPS 标头中的 → VUI → video_signal_type_present_flag →colour_description_present_flag → Transfer_characteristics);

  • 在基本视频流级别上指定 IDR 块的相应 SEI 标头上指定。包含参数referred_transfer_characteristics = 18。如果SEI、VUI或媒体容器中的值存在差异,则优先考虑SEI值。

3.3 HDR10+

该标准也描述了符合 UHDTV BT.2020 的视频内容。下表:HDR10+ 描述的视频内容

HDR10+ 使用 PQ EOTF,因此与 SDR 显示器不兼容。与 HDR10 不同,HDR10+ 使用动态元数据,可以在母带制作过程中更高效地编辑每个场景,从而完整地传达内容信息。在内容播放期间,显示器会以与作者创建它相同的方式从一个场景到另一个场景重新排列。

HDR10+ 提供与 HDR10 的向后兼容性。如果显示器不支持 HDR10+ 动态元数据,但支持 HDR10 静态元数据,并且此类数据存在于流或媒体容器中,则显示器可以播放 HDR10 视频序列。

对于 H.264/AVC 和 H.265/HEVC,动态元数据位于 SEI user_data_registered_itu_t_t35 中的基本流级别。在 VP9 中,元数据在 WebM 容器的 BlockAddID(ITU-T T.35 元数据)中指定。在 AV1 中,元数据在 metadata_itut_t35() OBU 语法中指定。

3.4 Dolby Vision

Dolby Vision 是由杜比开发和授权的最复杂的专有 HDR 标准。规定在一个视频文件中同时使用两层的可能性:基本层(BL)和增强层(EL)。事实上,由于视频文件的体积较大,且此类内容的准备和播放难度较大,因此很少会出现两个视频层。杜比视界有 5 个预定义的配置文件:4、5、7、8(8.1 和 8.4)和 9。

值得注意的是,新应用程序和服务提供商不支持Profile 4。Profile 8.4 处于标准化阶段,最大亮度级别为 1000 。

Profile 5、8、9 的 BL 和Profile 4 和 7 的 EL 使用 PQ EOTF,因此它们与 SDR 显示器不兼容。这些配置文件使用类似于 HDR10+ 元数据的动态元数据。这允许在母带制作过程中对每个场景进行高效编辑,并准确传达作者的想法。回放内容时,会根据动态元数据从场景到场景重新调整显示。

在 H.264/AVC 和 H.265/HEVC 视频格式中,杜比视界动态元数据位于基本视频流级别:

  • 在 SEI user_data_registered_itu_t_t35 ST2094-10_data();

  • 在相应 NAL 和 SEI 中基本流级别的 NALU 42/62 中。

杜比已为 MPEG-2 TS 和 MP4 媒体容器标准化了杜比视界识别。在 MPEG-2 TS 中,使用 PMT 表中的 DOVI 视频流描述符提供信息,根据其内容确定配置文件、级别、层的存在和兼容性。

为此,MP4 容器使用配置框:dvcc(适用于低于或等于 7 的配置文件)、dvvc(适用于高于 7 但低于 10 的配置文件)、dvwc(适用于等于或高于 10 的配置文件)。

4 HDR 标准总结

HDR 标准:一图总结

HDR 内容播放执的一般流程行如下图所示:

  1. 应用程序从 MP4、MKV/WebM、TS 等媒体容器中提取基本视频流和 HDR 元数据(如果存在),然后将数据传输到解码器;

  2. 解码器解码视频序列并提取动态HDR元数据,或从媒体容器中获取有关框架的静态HDR元数据;

  3. 解码器将解码后的帧和 HDR 元数据传输到显示器;

  4. 显示器输出图像。

如果有 2 个视频层(BL/EL——杜比视界中的配置文件 4 或 7),提取器会提取它们,但应用程序可以决定选择哪一层和相应的解码器,具体取决于平台的功能。

检查视频序列是否符合色度参数:

  1. BT.2020/2100和EOTF视频信号转换函数。对于所有 4 种视频编解码器(H.264/AVC、H.265/HEVC、VP9、AV1),这是标准化的相同参数集,包括:1)colour_primaries,表示根据 CIE 1931 规定的源原色的色度坐标
    2)transfer_characteristics,表示源图片的参考光电传递特征函数
    3)matrix_coeffs 描述用于RGB或 Y、Z 和 X 原色导出亮度和色度信号的矩阵系数 这些参数位于:对于 H.264/AVC 和 H.265/HEVC:
    1)在 VUI 标头中的基本流级别:序列参数集 → VUI → video_signal_type_present_flag → colour_description_present_flag;
    2)在 avcc、hvcc 或 colr 框中的 MP4 媒体容器级别;
    3)在相应的 TrackEntry 视频和colour box中的 MKV/WebM 媒体容器级别。
    对于 VP9:
    1) MP4:在 vpcc 和 сolr box;
    2)MKV/WebM:colour box。
    对于 AV1:
    1) 在 OBU 序列头中的基本流级别 → color_config → if(color_description_present_flag);
    2) 在 av1c 和 colr 框中的 MP4 媒体容器级别;
    3) 在相应的 TrackEntry 视频和colour box中的 MKV/WebM 媒体容器级别。

  2. 检查分辨率、纵横比、帧速率、色深、视频编解码器的合规性。

  3. HDR 元数据检查。


文章来源:

HDR in depth

【技术前沿】HDR转换曲线比较

  • 1
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值