03-图像基础-视音频参数

一、视频
1.分辨率
最直观的理解就是一幅图像横坐标和纵坐标所占的像素点个数。比如一幅720P的图像,其横坐标X有1280个像素点,纵坐标Y有720个像素点。整个画面所占的像素点个数就是1280720.
常见的分辨率有2560
1440,19201080,1280720,640*360等。

2.编码格式
常见的编码格式有h264和h265,编码的含义就是压缩,整个编码过程就是一个视频压缩的过程。
压缩的过程很复杂,此处只要了解含义即可。在实际工程中,一般会将YUV数据压缩成h264或h265格式进行存储或网络传输,节约硬盘和网络带宽资源,当然视频中的压缩基本上都是有损压缩。

3.编码质量
编码质量可以理解成画面质量。包括清晰度、锐度、镜头畸变、色散度、分辨率、色域范围、色彩纯度(色彩艳度)、色彩平衡等几方面指标。

4.码率
码率就是数据传输时单位时间传送的数据位数,一般我们用的单位是kbps即千位每秒。也就是取样率。码率越高对应的视频图像越清晰,但是所占用的带宽和存储空间越大。

5.帧率
视频可以理解成一组连续的图像画面,比如一个视频每秒钟有25钟有25张图像,也就是每秒钟有25帧,即25为帧率。
对于静止画面,帧率高低,对视频影响不大,但对于运动的画面,帧率越高,能表现的运动特性越明显。

6.I帧间隔
上面描述了帧率的概念,那什么是I帧间隔,首先我们要了解什么是I帧,什么是P帧。
I帧和P帧都是视频压缩中的概念。
 I帧是关键帧,属于帧内压缩,采用帧内编码方式,仅利用本帧内的数据进行编码。I帧包含了完整画面的数据,因此也被称为关键帧或独立帧。在解码时,I帧不需要参考其他帧即可独立解码出完整的画面。由于I帧包含了完整的数据,因此其数据量相对较大。
P帧是前向预测编码帧,采用帧间编码方式,它利用前面的I帧或P帧进行预测编码。P帧只包含与前一帧之间的差异数据,因此数据量相对较小。在解码时,P帧需要参考前面的I帧或P帧才能解码出完整的画面。
总的来说,I帧和P帧的关系是:P帧是在I帧的基础上进行压缩的,P帧的数据量相对较小,但解码时需要参考I帧或P帧才能生成完整的画面。
而I帧间隔表示每隔多少帧出现一个I帧,比如视频帧率为25,每2秒出一个I帧,即每50帧包含一个I帧49个P帧。 所对应的I帧间隔GOP=2.

7.码率类型
码率类型分为动态码率(VBR)和固定码率(CBR):
 动态码率:指编码器在对图像进行压缩编码的过程中,根据图像的状况实时调整码率高低的过程。例如当图像中没有物体在移动时,编码器自动将码率调整到一个较低的值;当图像中开始有物体移动时,编码器又自动将码率调整到一个较高的值,并且实时根据运动的剧烈程度进行调整。这种方式是一种图像质量不变,数据量变化的编码模式。
固定码率:指编码器在对图像进行编码的过程中,自始至终采用一个固定的码率值,不论图像情况如何变化。这种方式是码率量不变,而图像质量变化的编码模式。

二、音频
1.采样率
采样率是指在单位时间内对模拟信号进行采样的次数。
在数字音频中,采样率表示每秒从连续的模拟信号中提取并转换成数字信号的样本数量。较高的采样率可以更精确地捕捉原始信号的细节,使声音听起来更清晰、逼真,但同时也会增加数据量。常见的音频采样率有 44.1kHz、48kHz 等。

2.音频格式
(1).PCM:音频数据的源数据,一般处理理对Mic音频输入模块采样后得到的源数据就是PCM格式。
(2).G711:当得到音频数据后,可以对PCM进行压缩,在嵌入式系统中最常用的是G711A和G711U

3.声道数
声道数是指支持能不同发声的音响的个数,它是衡量音响设备的重要指标之一。

4.深度
每一个采样点所占的空间大小,有8比特,16比特
或32比特

5.音量
音量可以理解成声音的大小,也就是音频信号的振幅。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值