0 导读
1)分析Linux中的OSS声卡系统
2)移植wm9876声卡
1声音三要素
采样频率
音频采样率是指录音设备在一秒钟内对声音信号的采样次数, 常用的采样率有:
8KHz - 电话所用采样率, 对于人的说话已经足够清除
22.05KHz - 无线电广播所用采样率
32KHz - miniDV 数码视频、DAT所用采样率
44.1KHz - 音频 CD, 也常用于 MPEG-1 音频(VCD, SVCD, MP3)所用采样率
48KHz - miniDV、数字电视、DVD、DAT、电影和专业音频所用的数字声音所用采样率
50KHz - 商用数字录音机所用采样率
96K - BD-ROM(蓝光盘)音轨、和 HD-DVD (高清晰度 DVD)音轨等所用采样率
而2440开发板的采样频率IISRCK最高可以达到96KHz,满足了很多常用的采样场合,如下图所示:
其中CODECLK便是MCLK。
量化位数
指每个采样点里传输的数字信号次数,如下图所示, 其中蓝线表示模拟信号,红线表示数字信号,量化位越高,数字信号就越可能接近原始信号,音质越好
一般的量化位数为:
8位: 分成 256 次;
16位: 分为65536次, 已到 CD 标准;
32位: 分为 4294967296次,很少用到
2440的开发板只支持8位,16位,如下图所示:
其中LRCK就是采样频率,当LRCK为低时,表示传输的采样数据是左声道,当LRCK为高时,表示传输的采样数据是右声道,每个采样点,SD(serial data)都可以传输8位,或16位数字信号(从低位到高位传输)
声道数
常有单声道和立体声之分,(有的也处理成两个喇叭输出同一个声道的声音),而立体声更能感受到空间效果,但数据量翻倍。
所以,声音的每秒数据量(字节/s)= (采样频率 × 量化位数 × 声道数) / 8;
2WM9876声卡硬件分析
声卡是负责录音、播音、调节音量和声音合成等的一种多媒体板卡 。
本节使用的声卡是2440板上自带的WM9876声卡:
当我们播放声音时 ,将数字信号传入I2SDO脚,声卡便通过解码,产生模拟信号到喇叭/耳机
录音时,声卡便获取麦克风的模拟信号,编码出数字信号到I2SDI引脚上
WM8976接口分为两种:I2S接口(提供音频接收和发送)、控制接口(控制音量大小,使能各个输出通道等)
IIS接口相关的引脚如下
MCLK : 主机为编解码芯片提供的系统同步时钟 ( Master/system clock input ) ,在2440中,一般设置为256fs,或者384fs
BCLK: 编解码芯片提供的串行时钟信号 ( Audio bit clock output ) ,也就是量化位深,比如I2SIRCK=44.1khz,量化位为32位,则BCLK=44.1khz322
I2SLRCK: 采样频率信号,当为低电平时是采样的是左声道信号,为高电平是右声道信号,常见有44.1Khz(1fs)
I2SDI : ADC数据输入
I2SDO :DAC数据输出
如下图所示:
控制接口相关的引脚如下
CSB/GPIO1: 3线 控制数据使能引脚
SCLK: 3线/2线 时钟引脚
SDIN: 3线/2线 数据输入输出引脚
MODE: 3线/2线 控制选择,当MODE为高,表示为3线控制,MODE位低,表示2线控制,如下图所示:
其它引脚如下:
R/LOUT1:音频左/右输出通道1,外接耳机插孔
R/LOUT2:音频左/右输出通道2,未接
OUT3:单声道输出通道3,未接
OUT4:单声道输出通道4,未接
LIP/LIN:音频输入通道,外接麦克风
那么3线和2线的控制引脚又有什么区别?
3线控制:
如下图所示,3线控制,每周期都要传输16位数据(7位寄存器地址+9位寄存器数据),传输完成后,给CSB一个上升沿便完成一次数据的传输
2线控制:
如下图所示,2线控制就是I2C通信方式:
本节的WM8976的MODE脚接的高电平,所以是3线控制
3 接下来便来分析linux内核的声卡系统
在linux声卡中存在两种声卡系统,一种是OSS(开放声音系统),一种是ALSA(先
进Linux声音架构)。本节系统以OSS(Open Sound System)为例 ,
内核以linux-2.6.22.6版本为例,位于:linux-2.6.22.6\sound\Sound_core.c
3.1首先进入入口函数
如下图所示:
入口函数里,只注册了一个主设备号为(SOUND_MAJOR)14的“sound”字符设备和class类,这里为什么没有创建设备节点?
是因为, 当注册声卡系统的驱动后,才会有设备节点,此时这里的代码是没有驱动的,后面会分析到。
3.2 再来看看“sound”字符设备的file_perations:
这里只有个.open,为什么没有.read,.write函数?
显然在.open函数里做了某些处理,我们进入soundcore_open()来看看:
int soundcore_open(struct inode *inode, struct file *file)
{
int chain;
int unit = iminor(inode); //获取次设备号,通过次设备号来找声卡驱动
struct sound_unit *s;
const struct file_operations *new_fops = NULL; //定义一个新的file_operations
chain=unit&0x0F;
if(chain==4 || chain==5) /* dsp/audio/dsp16 */
{
unit&=0xF0;
unit|=3;
chain=3;
}
spin_lock(&sound_loader_lock);
s = __look_for_unit(chain, unit); //里面通过chains[chain]数组里找到sound_unit结构体
//一个sound_unit对应一个声卡驱动
if (s)
new_fops = fops_get(s->unit_fops); //通过sound_unit,获取对应的file_operations
... ...
if (new_fops) {
//当找到file_operations
int err = 0;
const struct file_operations *old_fops = file->f_op;//设上次的file_operations等于当前的
file->f_op = new_fops; //设置系统的file_operations等于s-> unit_fops
spin_unlock(&sound_loader_lock);
if(file->f_op->open)
err = file->f_op->open(inode,file);
if (err) {
fops_put(file->f_op);
file->f_op = fops_get(old_fops);
}
fops_put(old_fops);
return err;
}
spin_unlock(&sound_loader_lock);
return -ENODEV;
}
通过上面的代码和注释分析到,系统声卡之所以只有一个open(),里面是通过次设备号来调用**__look_for_unit()**函数,找到chains[chain]数组里的驱动声卡sound_unit结构体,然后来替换系统声卡的file_operations,实现偷天换日的效果。
__look_for_unit()函数如下图所示:
其中chains[]数组定义如下所示:
其中, chains[0]存放的Mixers,实现调节音量,高音等,就是我们VM8976的控制接口
chains[3]存放的DSP,用来实现音频输入输出,就是我们VM8976的I2S接口
显然VM8976的驱动有2个,需要将2个file_operations放入chains[0]和chains[3]数组里,供给系统的open()来调用
3.3 我们以DSP为例,搜索chains[3]来看看
如上图所示,显然register_sound_dsp()函数就是被我们声卡驱动调用的,用来注册dsp设备节点,继续进入sound_insert_unit()函数看看:
static int sound_insert_unit(struct sound_unit **list, const struct file_operations *fops, int index, int low, int top