音频基础2

音频基础(三)和弦铃声
0
0
一、数字音频格式
1、PCM格式及其分类
PCM 是未压缩(无损)的数字音频格式。其采样速率为可以为6、8、11.025、16、22.05、32、44.1、48、64、88.2、96、192KHz,采样精度可以为8、12、13、16, 20, 或24 bits。可以有1到8个声道。最大比特速率为6.144 Mbps,如果有5个或更多声道,这个最大速率就限制了采样率和比特位数。例如音频CD为44.1 kHz/16 bits/双声道;DVD不仅能够播放2声道的超高保真音响(192KHz/24bit/双声道),还能播放线性PCM 最多6个声道的环绕声音响(96kHz/24bit/6声道)。
PCM格式又根据其量化方式可以分为线性PCM(linear PCM)和非线性PCM(non-linear PCM),前者是均匀量化得到的,后者是非均匀量化得到的。
?         均匀量化
如果采用相等的量化间隔对采样得到的信号作量化,那么这种量化称为均匀量化。均匀量化就是采用相同的“等分尺”来度量采样得到的幅度,也称为线性量化,如图6所示。
?         非均匀量化
非线性量化的基本想法是,对输入信号进行量化时,大的输入信号采用大的量化间隔,小的输入信号采用小的量化间隔,如图7所示。这样就可以在满足精度要求的情况下用较少的位数来表示。声音数据还原时,采用相同的规则。
在非线性量化中,采样输入信号幅度和量化输出数据之间定义了两种对应关系,一种称为u律压扩(companding)算法,另一种称为A律压扩算法。
u律(u-Law)压扩(G.711)主要用在北美和日本等地区的数字电话通信中。它的输入和输出关系是对数关系,所以这种编码又称为对数PCM。A律(A-Law)压扩(G.711)主要用在欧洲和中国大陆等地区的数字电话通信中。A律压扩的前一部分是线性的,其余部分与u律压扩相同。
对于采样频率为8 kHz,样本精度为13位、14位或者16位的输入信号,使用u律压扩编码或者使用A律压扩编码,经过PCM编码器之后每个样本的精度为8位。
 
2、DSD音频格式
PCM脉码调制数字音频格式是70年代末发展起来的,记录媒体之一的CD,80年代初由飞利浦和索尼公司共同推出。PCM的音频格式也被DVD-A所采用,它支持立体声和5.1环绕声,1999年由DVD讨论会发布和推出的。
PCM的比特率,从14-bit发展到16-bit、18-bit、20-bit直到24-bit;采样频率从44.1kHz发展到192kHz。到目前为止PCM这项技术可以改善和提高的方面则越来越来小。只是简单的增加PCM比特率和采样率,不能根本的改善它的根本问题。其原因是PCM的主要问题在于: 1)任何PCM数字音频系统需要在其输入端设置急剧升降的滤波器,仅让20 Hz - 22.05 kHz的频率通过(高端22.05 kHz是由于CD 44.1 kHz的一半频率而确定),这是一项非常困难的任务。2)在录音时采用多级或者串联抽选的数字滤波器(减低采样率),在重放时采用多级的内插的数字滤波器(提高采样率),为了控制小信号在编码时的失真,两者又都需要加入重复定量噪声。这样就限制了PCM技术在音频还原时的保真度。
为了全面改善PCM 数字音频技术,获得更好的声音质量,就需要有新的技术来替换。近年来飞利浦和索尼公司再次联手,共同推出一种称为直接流数字编码技术DSD的格式, 其记录媒体为超级音频CD即SACD,支持立体声和5.1环绕声。
DSD音频格式简化了信号流程,去掉了PCM使用的多级滤波器,将模拟音频直接以2.8224MHz的高采样频率,按1-bit的数字脉冲来记录。虽然DSD格式表示的声音信号是数字化数据,但是它又与真正的声波非常接近,可完整的记录当今最佳模拟系统的信息。最好的30ips半英寸模拟录音机能记录的频率能超过50KHz,而DSD格式的频率响应指标为从DC到100KHz。能覆盖高级模拟调音台的动态范围,通过其音频频段的剩余噪声功率,保持在-120dB。DSD的频率响应和动态范围,是任何数字和模拟的录音系统无法与之比拟的。从声音的质量上来说, 数字音频技术是为了接近模拟声音的质量。DSD音频格式的发展将更有利的与模拟音频系统配合。
二、数字音频接口
常见的数字音频接口有I2S接口、PCM接口和SPDIF接口。这里只作简要介绍。
?         I2S接口:
只能传输单声道或双声道立体声的数字音频,数据格式为PCM格式。该接口又派生出三类:左对齐格式、右对齐格式、I2S格式。 I2S 时差性能要优于 SPDIF ,适合短距离通讯。
?         PCM接口:
也叫DSP模式音频接口。一般用来传输单声道或双声道立体声的数字音频,但是理论上也可以传输多声道的数字音频。数据格式为PCM格式。
?         SPDIF接口:
SPDIF (Sony Phillips Digital Interface) SONY 、PHILIPS数字音频接口。 它的传输载体有同轴和光纤两种,后者抗干扰能力更强。SPDIF能传输PCM流,也能传输杜比数字(Dolby Digital)、DTS这类环绕声压缩音频信号。PCM流是原始、未经压缩的音频信号,杜比数字、DTS也是来源于PCM流
二:
与音乐不同的是,和弦铃声都是制作出来的。播放的时候,只需要合成(或解码)就可以输出PCM格式的数据,然后PCM格式的数据可以通I2S接口传输,然后经过数-模转换输出。
1、  MIDI合成音乐
?         什么是MIDI?
MIDI(Musical Instrument Digital Interface)音乐设备数字化接口,也称为数字音序。“MIDI”文件(*.MID)不是声音文件,不是一段录制好的声音,而是记录声音的信息,然后再告诉声卡如何再现音乐的一组指令。可以做这样的比喻:如果数字音频是一个人独奏吉它时的录音带,MIDI文件则相当于该独奏曲的乐谱。虽然乐谱本身不能产生出任何实际的声音来,但是乐谱确定了音乐演奏得有多快,拨哪个音符,以及应该用多大的力度弹奏吉它。
我们可以从以下几点说明“MIDI”文件(*.MID)的特性:
1. 首先,正如上所说,它不是声音文件,只是一组指导声卡如何发声的指令,因此它生成的文件比较小。
2. 它只能应用于电子音乐设备(如电脑声卡等),而不能应用于人声。原因很简单,它发出的声音只能来自声卡中的内置音源(例如波表ROM中存储的音色)。自然界中那么丰富的音乐的和非音乐的声音,都是不能包括在内的。要在MIDI中混合自然界的模拟音效,一般是在在MIDI上叠加PCM/ADPCM。
    3. midi格式是记录每个音的音色、音名、响度、角度、时间等,根据记录查询音色库,得到应发声音。简单的说,每个音轨对应一种乐器,上面以特定的格式记录每时刻该乐器所演奏的乐音。比如,在某时刻被定义为钢琴的音轨上记录着上面所说的135组成的和弦,那么芯片就查询音色库得到所对应的音效,然后合成、播放。所以音色库是关系midi是否动听的关键因素,好的音色库是很占地方的。手机中记录音乐的方法与电脑上的midi相同或相似,不同的是它所记录的全是单音,而复杂的和弦音效没有记录。手机和弦芯片中的音色库都预先存储在内置的波表ROM中。
?         MIDI的分类:
MIDI格式后缀名是.MID,但其有MIDI0、MIDI1、MIDI2、SP-MIDI、XGMIDI等多种规范。
MIDI0和MIDI1:MIDI0是单音轨,MIDI1是多音轨。手机的和弦数目等于midi格式中的音轨数,手机的每个音轨都是单音音轨。网上的绝大多数MIDI音乐都是多音轨的。另外,MIDI0的读入和处理速度要快些,有的硬件可以直接读软盘上的MIDI文件回放(即时回放),而MIDI1的做不到。
SMF(Standard MIDI Format):是标准的MIDI格式,SMF分为format0和format1两种格式,即MIDI0和MIDI1。
SP-MIDIMIDI协会(MMA)推出一个新的规定Scalable Polyphony MIDI(简称SP-MIDI),大概可以译成“可升级的MIDI复音”。据介绍,这个规定主要作用是当合成器或音源的同时发音数小于作品的要求时,可以根据作曲家的事先决定省略某些音符或声部。例如一部为GM2音源写作的作品(要求32复音)在GM1或GM Lite音源上演奏的时候,由于同时发音数不足,必然有一些音符被忽略掉。过去这个决定权在机器方面,带有随机的性质,可能把乐曲搞得残缺不全。现在依据“可升级的MIDI复音”规定,控制权转移到作曲家手中,创作音乐的时候就可以设计好不同的“乐队编制”,使MIDI乐曲的正确演奏更有保证。另外,SP-MIDI标准为使用MIDI消息实现对振动提示的控制定义了一种可选方法, SP-MIDI内容中可以同时含有音频和振动两种表现形式。振动控制被定义为弦乐器。
?         什么是音乐合成技术?
音乐合成的途径
1. 采样合成(波表合成):这是最常见的音乐合成方式,为了得到钢琴声,就把钢琴在不同音阶下发出的声音录制保存下来,当播放音乐需要钢琴声时,录制下来的样本被调用并通过计算来获得正确的音符。其缺点是需要许多存储空间来保存高质量的声音样本。例如,大多数PC使用采样合成,其波表将占用8MB或更多存储空间,这对移动电话电话来说是一个非常大的开销。
2. 波谱匹配:Yamaha的调频合成(FM合成)同润威公司的GAP都属于这种类型。这种方式包括找到一个数学公式来调制乐器声音输出使得其像真正的乐器那样。这种方式使用很少的系统开销,同时也比采样合成使用的存储空间少很多。
?         MIDI的三个标准:GS、GM、XG
  音乐的要素之一是音色。在MIDI中,一种乐器就是一种音色(Patch,Program和Timbre)。现实的情况是不同的合成器和音源的制造者为了使自己的产品有独特之处,总是开发出若干种特殊音色,因而不同品牌的设备在音色种类和音色排列顺序方面会大不相同。这就导致了一个缺陷的出现:使用甲合成器制作的MIDI文件,换了乙合成器就不能正确播放。其原因在于甲合成器上01号音色可能是钢琴,而在乙合成器上,01号音色可能是打击乐或其他音色。总而言之。每一种MIDI设备的音色设置(以及其他方面)都具有排他性。这就使音乐家受到了设备的制约。为了有利于音乐家广泛地使用不同的合成器设备和促进MIDI文件的交流, MIDI协会(MMA)于1991年制订了“通用MIDI”(GM)标准。该标准以日本Roland公司的通用合成器(GS)标准为基础而制订。
    值得注意的是,虽然现在有了国际通用的GM标准可供电子乐器生产厂家参照,但仍有另外两个标准与GM标准共存,一个是GS标准,为Roland公司的产品所专用,它产生于GM标准出现之前,也是GM的前身。另一个是后来出现的XG标准,为YAMAHA公司的产品所专用。
1、GS标准。 GS为General Synthesizer的缩写,意为“通用合成器”,是罗兰公司创立的一种 MIDI标准。该标准具有有以下五种主要功能:1)16个声部。2)最大复音数为24或更多。3)GS格式的乐器音色排列,该格式包含有各种不同风格的音乐所使用的乐器音色和打击乐音色。4)鼓音色可以通过音色改变信息进行选择。5)包含两种可调节的效果,有混响和合唱。
2、GM标准。 GM是 General MIDI Mode(通用MIDI)的缩写,即GMM,通常缩写为GM。该标准是MIDI协会以罗兰公司的通用合成器(GS)标准为基础而建立的标准。该标准为一般合成器所共有的128种乐器音色(分成16组)规定了序号,将47种标准的非旋律性打击乐器分配在第10通道,并为这47种打击乐器规定了音符序号(35(B2)-81(A6))。以下是GM标准的128种音色分类表:
音色号
音色类别
1-8
钢琴
9-16
半音性打击乐器
17-25
风琴
26-32
吉它
33-40
贝司
41-48
弦乐器
49-56
合(唱)奏
57-64
铜管乐器
65-72
簧片乐器
73-80
管鸣乐器
81-88
合成领奏
89-96
合成背景音色
97-104
合成效果
105-112
民间乐器
113-120
打击乐
121-128
音响效果
表三   GM音色表
   3、XG标准。XG-MIDI是Extended General MIDI(扩展的通用MIDI)的缩写。XG是继GM标准建立之后,雅马哈公司于1994年推出的新的音源控制规格。XG在保持与GM兼容的同时,又增加了许多新的功能,其中包括音色库(音色数量)的增加,和启用更多的控制器对音色亮度等方面进行控制等等。
2、SMAF格式(文件扩展名.MMF)
合成音乐移动应用格式(Synthetic music Mobile Application Format,缩写为SMAF),是雅马哈公司首创的一种移动电话内容标准,是目前手机上使用非常多的和弦铃声,网络上有非常多的铃声资源可供下载。最常见的为MA2,MA3,MA5。MA2对应16和弦,MA3对应40和弦,MA5对应64和弦。与MIDI相比,它采用了MIDI+PCM/ADPCM的技术,故而支持真人铃声。
3、VMD
VMD技术是针对手机平台的新一代多媒体技术,该技术可以用于制作铃声、音乐、卡拉OK、动画、移动电视、流媒体播放等,为手机用户提供完美的多媒体体验。这标志着移动多媒体应用产业链的核心技术层面已经取得了关键性的突破,业内人士认为它将成为未来多媒体手机的新趋势。以铃声应用为例,目前普遍采用的MIDI播放效果受播放器或合成器的限制,由于文件尺寸较小无法嵌入人声、水声(wave或mp3)等自然界的声音,表现力不足;而WAVE和MP3文件格式可以保存自然界和乐器的声音。但 MP3需要快速解码,WAVE也需要格式转换。VMD格式中对MIDI音乐指令作了全面优化——这种格式对MIDI的指令合并精简,在保留完全相同音质的情况下,使得MIDI音乐指令的长度更小;VMD文件的组织结构也经过专门设计,使得文件组织模块化,从多轨转换为单轨,在这方面比其它格式更适合硬件平台处理。在文件格式上VMD吸取了SMIL等规范的优点,使得VMD-MIDI和WAV、MP3、JPEG等数据可以保留原有存储方式,也可以独立解析;MIDI部分不包含专门针对合成器硬件的繁琐的控制信息,能够广泛地被合成器厂商支持;VMD格式中对歌词、版权等文本信息使用UNICODE编码,可支持多国语言。此外,在VMD文件中还可以控制手机的LED和马达,实现声、光和震动一体化的效果,并嵌入音色库和音效
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值