一、前言
两周前接到任务,项目换了一个codec芯片,需要重新移植声卡驱动。
因为之前没有做过声卡驱动移植,所以对音频相关的知识都不怎么了解,为此,在网上搜索了很多资料。
写这篇博客,既是为了分享,也是记个笔记。
后续,我也会把这次移植声卡的前前后后分享出来。
二、音频相关
1、声音的数模转换
大学期间学习过数电模电的小伙伴应该对此概念不会陌生。
数模转换:数字信号与模拟信号之间的转换。
数字信号是在计算机内传输的信号(0/1);模拟信号则是通过一定介质传递的波,它可以由周期和振幅两个重要指标描述。
正常人可以听到的声音频率范围为 20Hz~20KHz。现实存在的声音是模拟量,这对声音保存和长距离传输造成很大的困难,一般的做法是把模拟量转成对应的数字量保存,在需要还原声音的地方再把数字量的转成模拟量。大致过程如下图所示:

模拟量转成数字量一般可以分为三个过程,分别为采样、量化、编码。举一个采正弦波信号的例子:

图中正弦波就是源音频信号,一条条直线就是在进行等距采样。
直线之间的距离大小为t(周期),而t=1/fs(采样率),试想,fs越大,t就越小,那么采到的源音频信号是不是就越多,得到的声音是不是就越清晰。
每条直线长度则决定着该时刻源音频信号的量化值,该量化值有另外一个概念与之挂钩,就是量化位数。量化位数表示每个采样点用多少位表示数据范围,常用有 16bit、 24bit 或 32bit,位数越高最后还原得到的音质越好,数据量也会越大。
2、模数转换的三要素
采用频率:每秒钟抽取声波幅度样本的次数。采样频率越高,声音质量越好,数据量也越大。常用的采样频率有11.025KHz,22.05KHz,44.1KHz,48KHz,96KHz等。
量化位数:每个采样点用多少二进制位表示数据范围。量化位数也叫采样位数。量化位数越多,音质越好,数据量也越大。常用的采样位数有8位,16位,24位,32位等。
声道数:使用声道的个数。立体声比单声道的表现力丰富,但是数据量翻倍。常用的声道数有单声道,立体声(左声道和右声道)。
3、模数转换后的数据量
声音数字化后的数据量计算公式为:
音频数据量 = 采样频率(Hz) * 量化位数 * 声道数 / 8,单位:字节/秒。
这里举个例子:对一个声音信号进行数字化处理,采样频率为16KHz,量化位数为16位,那么:
单声道的音频数据量为:16000 * 16 * 1 / 8 = 32000 字节/秒;
立体声的音频数据量为:16000 * 16 * 2 / 8 = 64000 字节/秒。
4、声卡
声卡是负责录音、播音和声音合成的一种多媒体板卡。其功能包括:
1、录制、编辑和回放数字音频文件;
2、控制和混合各声源的音量;
3、记录和回放时进行压缩和解压缩;
4、语音合成技术(朗读文本);
5、具有MIDI接口(乐器数字接口)。
声卡的芯片类型:
1、CODEC芯片(依赖CPU,价格便宜);
2、数字信号处理器DSP(不依赖CPU)。
三、I2S总线及其协议
1、I2S总线
I2S总线是飞利浦公司为数字音频设备之间的音频数据传输而制定的一种总线标准,该总线专责于音频设备之间的数据传输,广泛用于各种多媒体系统。
特点:
①、支持全双工和半双工模式。
②、支持主从模式。
2、接口
I2S总线一般包含三根CLK时钟总线和多达四根的DATA总线。
①、MCLK
主时钟,系统时钟。
计算方法:freq(MCLK)=128/256/512 * fs。目前公司用的512 * fs。
fs为采样频率。
②、SCLK
串行时钟,也叫位时钟BCLK,对应数字音频的每一位数据,SCLK都有一个脉冲,
Freq(SCLK)=声道数*fs*采样位数。
③、字段选择信号WS
字段选择信号WS,也叫LRCLK,用于切换左右声道的数据。WS为0,表示正在传输的是左声道的数据;WS为1,表示正在传输的是右声道的数据。
Freq(WS)=fs。
④、串行数据SD
串行数据SD,就是用二进制补码表示的音频数据。
I2S在传输数据的时候,由高位(MSB)到低位(LSB)一次进行传输。
对于系统而言,能够产生SCLK和WS的信号端就是主设备,用MASTER表示。
3、I2S数据格式
I2S共有三种数据格式,左对齐(MSB)、右对齐(LSB)、I2S Philips标准。
对于所有数据格式和通信标准而言,始终会先发送最高有效位(MSB优先)。
发送端和接收端必须使用相同的数据格式,确保发送和接收的数据一致。
①、I2S Philips标准
使用LRCLK信号来指示当前正在发送的数据所属的声道,为0时表示左声道数据。LRCLK信号从当前声道数据的第一个位(MSB)之前的一个时钟开始有效。LRCLK信号在BCLK的下降沿变化。发送方在时钟信号BCLK的下降沿改变数据,接收方在时钟信号BCLK的上升沿读取数据。正如上文所说,LRCLK频率等于采样频率Fs,一个LRCLK周期(1/Fs)包括发送左声道和右声道数据。
对于这种标准I2S格式的信号,无论有多少位有效数据,数据的最高位总是出现在LRCLK变化(也就是一帧开始)后的第2个BCLK脉冲处。这就使得接收端与发送端的有效位数可以不同。如果接收端能处理的有效位数少于发送端,可以放弃数据帧中多余的低位数据;如果接收端能处理的有效位数多于发送端,可以自行补足剩余的位。这种同步机制使得数字音频设备的互连更加方便,而且不会造成数据错位。
②、左对齐(MSB)
在LRCLK发生翻转的同时开始传输数据。该标准较少使用。注意此时LRCLK为1时,传输的是左声道数据,这刚好与I2S Philips标准相反。左对齐(MSB)标准时序图如下所示:
③、右对齐(LSB)
声音数据LSB传输完成的同时,LRCLK完成第二次翻转(刚好是LSB和LRCLK是右对齐的,所以称为右对齐标准)。注意此时LRCLK为1时,传输的是左声道数据,这刚好与I2S Philips标准相反。右对齐(LSB)标准时序图如下所示: