音视频面试题集锦一

这篇博客讨论了在音视频处理中如何判断H.264和H.265编码,选择解码器的依据,以及为何视频会议倾向于使用UDP,并介绍了用UDP保证音视频通话质量的方法。此外,还提到了CDN在直播中的应用及其工作原理,以及YUV数据格式相对于RGB的优点。
摘要由CSDN通过智能技术生成

1)如何根据 NALU 裸流数据来判断其是 H.264 编码还是 H.265 编码?

1)通常在处理音视频数据时,我们如何选择解码器?

通常我们不是根据 NALU 裸流数据中的信息来选择解码器,而是根据媒体封装层的信息来确定解码器。

媒体封装层是表示媒体数据是什么封装格式的,比如 MP4、FLV。在这层信息里,通常会携带码流编码格式的信息。

拿 MP4 来说,我们可以根据 Sample Description Box(moov/trak/mdia/minf/stbl/stsd) 中的信息来确定其封装的码流的编码格式。

对于 FLV,我们可以根据 VideoTagHeader 中的 CodecID 等信息来确定其封装的码流的编码格式。

这样的好处是效率比较高,解封装的时候就可以确定选择何种解码器了。

2)怎么识别 NALU 裸流数据的编码格式是 H.264 还是 H.265?

但是,如果出现题目中的情况,没有对码流进行封装,而是直接传输码流时,这时候 NALU 中有什么字段能标识自己的编码格式吗?答案是,没有这样明确的字段能标识码流的编码格式。

但是这个问题也不是不能解决,因为 H.264、H.265 码流本身也是遵循一定格式规范的,我们可以按照它的格式规范进行探测,如果能解析出来正确的信息,那也可以确定它的编码格式。

比如,拿 H.265 来说,FFmpeg 中 hevcdec.c 就有对其码流数据进行探测的函数 hevc_probe(...)

所以,我们可以按照编码格式规范探测,比如 H.265 如果解析出了 pps、sps、v

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值