Android Audio System线性音量和对数音量的转换

Android的音频系统的代码中,应用程序对每个音频流的音量做出调整后,最终会转换为一个系数K,所有的音频数据在输出到硬件之前,都要乘以系数K,只要应用程序发出调整音量的调用,中间层的Audio System就会重新计算系数K的值。对应用程序来说,音量控制通常都是按照线性进行调整的,比如对于具有15级音量的音频流来说,我们预期每级的音量变化都是相当的,也就是说:从第5级调到第6级,和从第7级调到第8级,我们期望人耳可以感觉到同样大小的音量变化。但是,在Android的代码中,我们看到了计算系数K的公式,它相当奇怪,代码位于frameworks/base/media/libmedia/audiosystem.cpp中:

/*****************************************************************************************************/
声明:本博内容均由http://blog.csdn.net/droidphone原创,转载请注明出处,谢谢!
/*****************************************************************************************************/

// convert volume steps to natural log scale

// change this value to change volume scaling
static const float dBPerStep = 0.50f;
// shouldn't need to touch these
static const float dBConvert = -dBPerStep * 2.302585093f / 20.0f;
static const float dBConvertInverse = 1.0f / dBConvert;

float AudioSystem::linearToLog(int volume)
{
    // float v = volume ? exp(float(100 - volume) * dBConvert) : 0;
    // LOGD("linearToLog(%d)=%f", volume, v);
    // return v;
    return volume ? exp(float(100 - volume) * dBConvert) : 0;
}

int AudioSystem::logToLinear(float volume)
{
    // int v = volume ? 100 - int(dBConvertInverse * log(volume) + 0.5) : 0;
    // LOGD("logTolinear(%d)=%f", v, volume);
    // return v;
    return volume ? 100 - int(dBConvertInverse * log(volume) + 0.5) : 0;
}

要理解上面代码中的公式,我们先要了解人耳的声心理学模型。根据人耳的声心理学的研究,人耳对声音大小的感知程度并不是线性的,而是呈对数关系。对数形式的单位是dB,在音频领域,通常我们会定义一个标准电平V0,那么电平X的转换公式是:

dB=20log(X/V0);

例如:我们给喇叭输出满负荷最大音量时的电平是1V,如果有15级音量,如果按线性进行调整,1/15 = 66.6mV,我们就得到每级音量的调整量是:

66.6mV,133.2mV,200mV,......,866.8mV,933.4mV,1000mV;

如果按照这个步长进行调整,人耳感觉到的音量变化就不是连续的。

另一种方式是按对数进行调整,在数字音频领域,通常0dB代表最大音量,0dB意味着不对数据进行任何的变换处理,输出等于输入,所以20log(V0/V0)=20log(1)=0dB。这意味着最大音量以下的dB值为一个负数,现在我们把1V认为是0dB,最低音量是-28dB,那么对应15级音量的dB值就是:

-28dB,-26dB,-24dB,......,-4dB,-2dB,0dB;

对应的电平值是( 使用公式Vx=10^(dB/20)*V0 ):

39mV,50mV,63mV,......,630mV,794mV,1000mV;


                                      线性音量和对数音量的调整曲线

回到Android的代码中,它也使用了对数的调节方式,它先是定义了每次调节音量的步长值为0.5dB:

static const float dBPerStep = 0.50f;

然后他定义了一个计算用的中间常数:

static const float dBConvert = -dBPerStep * 2.302585093f / 20.0f;

这个一开始有点难于理解,尤其是奇怪的系数:2.302585093。所有这些定义都是为了得到用于与音频数据相乘的系数K,Android中有多种音频流,每种音频流的默认音量调节步数都不一样,有的是7步,有的是5步,有的是15步,为了便于计算的统一,计算前都会先把相应的步数映射为0-100步之间,因为步长已经定义为0.5dB,所以各级音量对应的dB数如下:

音量级别0123......979899100
dB数mute-49.5dB-49dB-48.5dB......-1.5dB1.0dB0.5dB0dB

很显然,知道了音量为哪个步数级别后,相应的dB值也会知道,那么我们要做的就是把dB值转换为系数K值,K值实际上就是公式dB=20log(X/V0)中的比值:X/V0,根据此公式反推,音量级别为volume对应的K值:

(1)          dB = -dBPerStep * ( 100 - volume );

又因为:

(2)          dB/20 = log(Vx/V0) = log(K);

把(1)式代入(2)式:

(3)          -dBPerStep * ( 100 - volume ) / 20 = log(K);

为了得到K,两边取以10为底的指数:

(4)           10 ^ ( -dBPerStep * ( 100 - volume ) / 20 ) = 10 ^ ( log(K) );

(5)            K = 10 ^ ( log(K) ) = 10 ^ ( -dBPerStep * ( 100 - volume ) / 20 ) ;

(6)             K = 10 ^ ( dBConvert * ( 100 - volume ) ) ;      // 令:dBConvert = -dBPerStep  / 20;

使用(6)式即可得到系数K,需要计算以10为底的幂,可是这与Android使用的计算公式有些差异,Andrioid使用的公式是:

(7)            exp(float(100 - volume) * dBConvert);

这是因为它没有使用以10为底的幂运算,而是使用以自然常数e为底的幂运算,因为:

(8)           ln( 10)  = 2.302585093;

我们把dBConvert 重新定义为-dBPerStep * 2.302585093/ 20后,式子(6)和式子(7)实际上是完全等价的。也就是说:

(9)           e^2.302585093 = e^ln(10) = 10;

这下终于知道2.302585093这个奇怪数字的来历啦!!从代码的注释中,我们可以知道,只要改变dBPerStep的大小,就可以决定系统的最小音量了:

最小音量 = -99 * dBPerStep;默认情况下是-49.5dB,K值为:0.00334965439;

至于最大软件数字音量,就是0dB,不能改变,要改就修改底层的音频驱动的硬件音量吧!!




  • 4
    点赞
  • 34
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
要修改录音音量,可以通过调整AudioRecord对象的采样率和音频格式来实现。下面是一个简单的示例代码: ```java //设置采样率为16kHz int sampleRate = 16000; //设置音频格式为PCM编码 int audioFormat = AudioFormat.ENCODING_PCM_16BIT; //设置录音声道为单声道 int channelConfig = AudioFormat.CHANNEL_IN_MONO; //设置缓冲区大小 int bufferSize = AudioRecord.getMinBufferSize(sampleRate, channelConfig, audioFormat); //创建AudioRecord对象 AudioRecord audioRecord = new AudioRecord(MediaRecorder.AudioSource.MIC, sampleRate, channelConfig, audioFormat, bufferSize); //开始录音 audioRecord.startRecording(); byte[] buffer = new byte[bufferSize]; int read = 0; while (true) { read = audioRecord.read(buffer, 0, bufferSize); if (read > 0) { //修改音量 for (int i = 0; i < read / 2; i++) { //左右声道分别处理 short left = (short) ((buffer[i * 2] & 0xff) | (buffer[i * 2 + 1] << 8)); short right = (short) ((buffer[i * 2 + 2] & 0xff) | (buffer[i * 2 + 3] << 8)); //将左右声道的音量都增加一倍 left *= 2; right *= 2; //处理后的左右声道数据写回缓冲区 buffer[i * 2] = (byte) (left & 0xff); buffer[i * 2 + 1] = (byte) ((left >> 8) & 0xff); buffer[i * 2 + 2] = (byte) (right & 0xff); buffer[i * 2 + 3] = (byte) ((right >> 8) & 0xff); } //将处理后的缓冲区数据写入文件或进行其他处理 } } //停止录音 audioRecord.stop(); audioRecord.release(); ``` 在上面的代码中,我们使用了一个简单的算法来将左右声道的音量都增加一倍。你也可以根据需要使用其他算法来调整音量

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值