视频(图像)
存储方式,可以分为分别存储和打包存储两种,分别存储是所有像素的同一分量存储在一起,如YUV420P则是先存储所有的Y分量,然后是U分量和V分量;打包存储是指一个像素的数据连续存放,如RGB24,则是R G B R G B连续存放。RGB三个分量分别用8bit来表示,其取值范围为0——255。RGB通过转换公式得到YUV:Y=0.30R+0.59G+0.11B , U=0.493(B-Y) , V=0.877(R-Y)。再经过压缩和350mV电压偏置,将色差信号的幅度范围控制在0——700mV。显像时需要转换回RGB格式,转换公式为:
R = Y + 1.4075 *(V-128)
G = Y – 0.3455 *(U –128)–0.7169 *(V –128)
B = Y + 1.779 *(U – 128)
为了节省空间,YUV多采用4:2:0的存储格式。即指对于一个2*2的像素块,Y分量占用4个字节,U和V分量各占用1个字节,这样对于一个像素,若采用RGB24存储,则占用3个字节,若采用YUV420P存储,则占用1.5个字节,大大节省了存储空间。对于一个640*480分辨率大小的图像,Y占用空间640 * 480,U占用640 * 480 / 4,V占用640 * 480 / 4。
音频
WAV(Waveform audio format)是微软与IBM公司所开发的一种声音编码格式,它符合RIFF(Resource Interchange File Format)文件规范。音频格式没有经过压缩,所以不会出现音质失真的问题。。每个WAVE文件的头四个字节便是“RIFF”。WAVE文件由文件头和数据体两大部分组成。其中文件头又分为RIFF/WAV文件标识段和声音数据格式说明段两部分。
常见的声音文件主要有两种,分别对应于单声道(11.025KHz采样率、8Bit的采样值)和双声道(44.1KHz采样率、16Bit的采样值)。WAVE文件数据块包含以脉冲编码调制(PCM)格式表示的样本。WAVE文件是由样本组织而成的。在单声道WAVE文件中,声道0代表左声道,声道1代表右声道。在多声道WAVE文件中,样本是交替出现的。