音频筑基:巴克谱和梅尔谱辨析

音频筑基:巴克谱和梅尔谱辨析

在音频信号处理中,巴克谱和梅尔谱是我们经常遇到的概念,也是语音处理中常用到的频域特征,这里谈谈自己对它们的理解。

是什么


巴克谱又称Bark Spectrum,梅尔谱又称Mel Spectrum,其中异同梳理如下:

  • 相同点:
    • Bark谱和Mel谱都是将线性频谱映射到非线性谱上的表征,根据不同频带的感知能力来划分,但它们的核心思想不同。
    • 这两种谱都是语音信号处理中常用的特征提取方法,它们可以用于基频、降噪、编解码、特殊声音检测等领域。
  • 不同点:
    • 机理不同:
      • BFCC(Bark-Frequency Cepstral Coefficents),人耳对响度感知灵敏度确定的频带划分方法, amplitude/loudness
      • MFCC(MelScale-Frequency Cepstral Coefficents),人耳对音高感知灵敏度确定的频带划分方法, pitch
    • 映射函数不同:
      • Bark谱将线性频谱映射到Bark域上,以符合人耳听觉机理。在Bark域上分布是非线性的。Bark谱通常基于MDCT弄的,常用于编解码领域。
      • Mel谱将线性频谱映射到Mel频率域(对数log)上,以模拟人类听觉系统机理。在Mel频域上,分布是线性的。Mel谱通常基于STFT弄的,使用更广泛。
    • 两者的区别在于映射函数不同,Bark谱的映射函数是非线性的,而Mel谱的映射函数是线性的。

深入了解


巴克谱/bark刻度具体如何解释?

  • bark刻度指的是频点分带策略按人耳听觉感知特性,对0-15500Hz频点从听感上进行等间距划分24个带,低于500Hz的bark刻度近似线性,高于500Hz的bark刻度近似对数尺度。
  • bark谱划分最高到15.5kHz,若到20kHz需增加为25个带(15.5-20k)
  • bark谱的关键在于临界带的宽度,而非具体位置

相关参考


  1. 语音特征小结 - 知乎 (zhihu.com)],link
  2. 音频处理中的尺度–Bark尺度与Mel尺度_bark(巴克)频率尺度-CSDN博客,link
  3. Bark谱维基百科,link
  • 8
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 二相编码m序列码和巴克码是两种常用的数字编码方式,它们在应用领域和编码原理上有所不同。 1. 应用领域不同:二相编码m序列码主要用于通信系统中的数据传输,通过将原始数据序列与伪随机序列进行异或操作产生编码后的信号;而巴克码则通常用于数据存储中,特别是在磁盘存储中常使用巴克码编码来降低磁头与磁介质之间的相互干扰。 2. 编码原理不同:m序列码是一种伪随机序列,由反馈移位寄存器通过特定的逻辑函数产生,具有良好的随机性和相关性质,能够实现高速的数据传输与检测;而巴克码是一种于曼彻斯特编码的差分编码方式,通过将每个数据位变化前后的不同表示为高低电平的切换,以便于接收端进行时钟恢复和误码检测。 3. 编码效率不同:m序列码在编码后的数据传输中能够达到较高的编码效率,因为在每个码元间都有较多的信息传输;而巴克码则相对较低,因为它需要在每个码元中包含额外的编码位来表示数据的变化。 总的来说,二相编码m序列码和巴克码有着不同的应用领域和编码原理,各有各的优势和适用范围。在数据传输中,根据具体需求选择适当的编码方式可以提高传输速度和保证数据可靠性。 ### 回答2: 二相编码m序列码和巴克码是数字通信中常用的两种编码方式。 首先,二相编码m序列码是由m序列生成器产生的伪随机码序列,其中m序列是一种线性反馈移位寄存器(LFSR)产生的序列。二相编码m序列码是通过将每一个比特位与前一个比特位进行异或操作得到的编码,其优点是简单易实现,并且具有良好的自相关性和周期性。该编码方式广泛应用于调制、扩频和多址等通信系统中。 而巴克码,是一种于变换编码的数字编码方式。与二相编码m序列码不同,巴克码具有更长的码字长度。巴克码是通过将输入信号进行不同的线性组合来生成编码信号的。这种编码方式是通过指定码字的相对码率来进行编码的,以保证编码后的信号的特定性能(如能量分散性、码距和频带占用等)。巴克码主要应用于高速数据传输和数字通信中。 因此,二相编码m序列码和巴克码的区别主要体现在生成编码序列的方式和应用领域上。二相编码m序列码是通过异或操作生成的伪随机码序列,适用于调制、扩频和多址等通信系统;而巴克码是通过变换编码生成的码序列,适用于高速数据传输和数字通信中。 ### 回答3: 二相编码m序列码与巴克码是两种常见的数字编码方法,它们在应用场景、生成方式和编码结果等方面存在一些区别。 首先,二相编码m序列码常用于数字通信中的调制解调过程。m序列码是由线性反馈移位寄存器(LFSR)生成的伪随机序列,由0和1两个数字构成。每个bit时间内,m序列码会根据当前寄存器的状态决定输出0或1,从而实现数字数据的编码。这种编码方式可以在信道传输中提供良好的抗干扰性能。 然而,巴克码则主要用于数据存储与传输领域。它是一种三进制编码方式,使用0、+1和-1三个数值表征数据。巴克码是通过将二进制数据转换为三进制,并采用特定的数值映射关系生成编码结果。巴克码的优点是可以有效地压缩数据,提高存储和传输效率。此外,巴克码还具有解码自纠错的特性,即当接收到一部分错误的码字时,仍然可以正确解码出原始数据。 总结起来,二相编码m序列码和巴克码的主要区别在于应用场景、生成方式和编码结果。m序列码通常用于数字通信的调制解调过程,是由LFSR生成的伪随机序列;而巴克码主要用于数据存储与传输领域,通过将二进制数据转换为三进制并采用特定映射关系生成编码结果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值