音频HiFi的二三事

本文详细介绍了Hi-Fi音乐的基本概念,包括PCM、DSD、MP3等编码格式的差异,以及无损与有损编码的特点。深入探讨了音乐标签、前端与后端设备如DAC、运放和功放的工作原理和影响音质的因素。此外,还对比了胆机与石机的音质特点,并分析了为何前端设备对音质影响的‘玄学’现象。最后,推荐了几款适用于Windows和Mac的高质量播放器。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

基本概念

HiFi

Hi-Fi是英语High-Fidelity的缩写,翻译为“高保真”,其定义是:与原来的声音高度相似的重放声音。

音乐编码格式
PCM

Pulse Code Modulation,脉码调制录音。将模拟信号每隔一定时间进行取样,使其离散化,同时将抽样值按分层单位四舍五入取整量化,同时将抽样值按一组二进制码来表示抽样脉冲的幅值。

WAV、APE和FLAC文件都是PCM编码格式数据的存储文件,WAV没有压缩,APE和FLAC都是对PCM数据进行无损压缩后的存储文件格式。
WAV是将PCM信息块直接加一个WAV的文件头,没有经过压缩,体积很大。
APE由软件Monkey’s audio压制得到,该软件源代码开放。推出时间较早,APE有查错能力但不提供纠错功能,压缩率约为55%,比FLAC稍高。
FLAC代表 Free Lossless Audio Codec - 免费的无损音频压缩,是一个完全公开、完全免费的音频格式。FLAC的压缩和解码速度均显著优于APE,FLAC相比APE的解码复杂程度要较低并获得了广泛硬件解码支持,FLAC容错性稍好一些。

DSD

DSD是Direct Stream Digital(直接比特流数字编码),是SACD(Super Audio CD)的编码模式。

DSD使用1bit比特流的方式取样,采样率2.8224MHz(CD 44.1kHz取样的64倍)的高取样方式,直接把模拟音乐讯号波形以脉冲方式转变为数字讯号,以将近四倍于CD的空间,储存音乐,因此可以提供更为优秀的声音效果,由于取样次数高,所以取样过的波形很圆顺,比较接近原来的模拟波形。
但是,DSD无法做混音处理,只有PCM才能做混音处理。所以几乎所有的录音室所用母带还是PCM格式,混音完成了以后再压缩成DSD格式,制作成SACD,这个过程实际上已经丢掉了DSD的大半优势。

它是Sony与Philips在1996年宣布共同发展的高解析数字音响规格。DSD数据封装为文件有2种格式,DIFF是飞利浦推出的,DSF则是索尼推出的。DIFF文件对tag信息不是很友好,DSF则很友好。

有损编码格式

MP3,也就是指的是MPEG标准中的音频部分。具有10:1到12:1的高压缩率,同时基本保持低音频部分不失真。MP3没有版权保护技术。
典型的比特率介于128kbps和320kbps(kbit/s)之间。一般认为,320 kbit/s 音质优秀,192 kbit/s 音质优良,128 kbit/s 音质可接受。后来发展出可变编码率的压缩方式(VBR),将复杂部分用高bitrate编码,简单部分用低bitrate编码,进一步取得质量和体积的统一。

MIDI(Musical Instrument Digital Interface)格式被经常玩音乐的人使用,MIDI允许数字合成器和其他设备交换数据。对应的文件为MID文件。
MID文件并不是一段录制好的声音,而是记录声音的信息,然后再告诉声卡如何再现音乐的一组指令。这样一个MIDI文件每存1分钟的音乐只用大约5~10KB。MID文件主要用于原始乐器作品,流行歌曲的业余表演,游戏音轨以及电子贺卡等。

WMA (Windows Media Audio) 格式是来自于微软,音质要强于MP3格式。WMA可以通过DRM(Digital Rights Management)方案加入防拷贝保护,还支持音频流(Stream)技术,适合在网络上在线播放。
WMA以减少数据流量但保持音质的方法来达到比MP3压缩率更高的目的,WMA的压缩率一般都可以达到1:18左右。实际上当采用LAME算法压缩MP3格式时,高于192kbps时普遍的反映是MP3的音质要好于WMA。

AAC实际上是高级音频编码(Advanced Audio Coding)的缩写,它是MPEG-2规范的一部分,是苹果相关设备支持的音频文件的主要格式。
AAC由Fraunhofer IIS、杜比实验室、AT&T、索尼等公司共同开发,目的是取代MP3格式。AAC的音频算法在压缩能力上远远超过了以前的一些压缩算法(比如MP3等)。它还同时支持多达48个音轨、15个低频音轨、更多种采样率和比特率、多种语言的兼容能力、更高的解码效率。
2000年,MPEG-4标准出现后,AAC重新集成了其特性,加入了SBR技术(频段复制,在低数据速率下改善编码性能)和PS技术(变量立体声,进一步提高了编码效率),为了区别于传统的MPEG-2 AAC又称为MPEG-4 AAC,或者HE-AAC、AAC+。

音乐标签

ID3,一般是位于一个mp3等音乐文件的开头或末尾的若干字节内,附加了关于该mp3的歌手,标题,专辑名称,年代,风格等信息,该信息就被称为ID3信息。

ID3信息分为两个版本,ID3v1和ID3v2版。
其中:ID3v1在音乐文件的末尾128字节,以TAG三个字符开头,后面跟上歌曲信息。
ID3v2位于音乐文件的开头,可以存储歌词,该专辑的图片等大容量的信息。

ID3V2一共有4个版本,但流行的播放软件一般只支持第3版和第4版,即ID3v2.3和ID3v2.4。
ID3V2.4与ID3v2.3最大的差异在于ID3v2.4增加了Footer栏位,使其可置于档案的开头或是结尾(放在结尾,并同时与ID3v1存在时,在ID3v1之前),此外,他们支持的编码,具体的结构等均存在不同。

APEv2位于文件尾部(同时与ID3v1存在时,在ID3v1之前),同样支持封面和特殊字符,但不推荐用于mp3。

前端与后端

前端是指播放器、解码、功放等设备。
后端是指耳机、音响等设备。

DAC

数模转换器,又称D/A转换器,简称DAC,它是把数字量转变成模拟的器件。
D/A转换器基本上由4个部分组成,即权电阻网络、运算放大器、基准电源和模拟开关。

运放

运算放大器是一个内含多级放大电路的电子集成电路,其输入级是差分放大电路,具有高输入电阻和抑制零点漂移能力;中间级主要进行电压放大,具有高电压放大倍数,一般由共射极放大电路构成;输出极与负载相连,具有带载能力强、低输出电阻特点。
由于早期应用于模拟计算机中用以实现数学运算,因而得名“运算放大器”。

功放

功率放大器简称功放,一般特指音响系统中一种最基本的设备,俗称“扩音机”,它的任务是把来自信号源(专业音响系统中则是来自调音台)的微弱电信号进行放大以驱动扬声器发出声音。

类型分为:利用模拟功率放大器进行模拟信号放大,如A类、B类和AB类放大器;直接从数字语音数据实现功率放大而不需要进行模拟转换,这样的放大器通常称作数字功率放大器或者D类放大器。

AV功放和HiFi功放

AV功放是专门为家庭影院用途而设计的放大器,一般都具备4个以上的声道数以及环绕声解码功能,且带有一个显示屏。该类功放以真实营造影片环境声效让观众体验影院效果为主要目的。
但是由于AV功放在电路的信号流通环节上,经过了太多而且复杂的处理电路,使声音的纯净度”受到了过多的“染色”,所以用AV功放兼容HI-FI重放时效果不理想。

Hi-Fi功放是为高保真地重现音乐的本来面目而设计的放大器,一般为两声道设计。它的输出功率一般大都在2X150w以下。设计上以“音色优美,高保真”为宗旨。价格也从千余元到几十万元不等,是发烧友的追求。

胆机

胆机指的是电子管的音频功率放大器。
电子管有的用于功率放大,有的用于润色即电压放大。
胆机有他独特的“胆味”,声音温暖耐听,音乐感好,氛围好。 胆机是音响业界最古老而又经久不衰的长青树,其显著的优点是声音柔和、自然亲切,尤其动态范围较大,听感很有特色。

胆机分单端、推挽两大类,各有特点:
单端机功率小,声音特别有人情味,就是常说的胆味,但是功率小。推挽机比单端机做到比较大的功率,不过声音比起单端来偏向石机的风格。
同时在工艺上,单端机比推挽机要难处理一些。因此,单端电路往往在高档机中采用,推挽电路在普及机中采用。

石机

晶体管功放,以半导体器件为放大元件的音频功率放大器称为石机。

石机最初的功放为甲类功放,这种功放电路效率低,动态范围小,且频响特性较差;
后来推出了乙类推挽式功率放大器,这种功放电路在整个音频段内,负载特性不均衡,相移失真较严重;
再后来推出了OTL的功率放大电路,并在此之上改良推出了OCL和BTL电路。

胆石机

“前胆后石”(电子管、晶体管混合功放)功放 采用前胆后石设计的HIFI功放效果比单纯的“胆机”或“石机”的效果要好。

在功率放大器的设计中,设计者将其内部分为前级放大和后级放大。
前级放大,其主要作用是对信号源传输过来的音频信号进行必要的处理(过滤)和电压放大后,再输出到后级功放。
而后级放大则是单纯的功率放大部分,它的作用就是尽可能高倍数放大来自于前级的信号,并避免失真。后级放大器中还设计有各种保护电路,如短路保护、过压保护、过热保护、过流保护等。

在功放的前级放大部分采用电子管放大声音信号,能够使输入的声音信号具有良好的声音表现和高动态范围,具有音色自然、逼真的特点,而在后级功率放大部分采用晶体管放大则能够保证输出的声音信号的速度和功率,这种设计能够集两种放大技术的优点于一身。

其他
ASIO

ASIO是Audio Stream Input Output的简称,是专业声卡驱动模式的一种简称。采用ASIO技术可以减少系统对音频流信号的延迟,增强声卡硬件的处理能力。

WASAPI

WASAPI的全称是Windows Audio Session API,是从Windows Vista之后引入的UAA(Universal Audio Architecture)音频架构所属的API。WASAPI允许传输未经修改的比特流到音频设备,从而避开SRC(Sample Rate Conversion,取样率转换器)的干扰。
对于Windows XP来说,与WASAPI类似的通道为ASIO。

THD+N

THD+N是英文Total Harmonic Distortion +Noise 的缩写,译成中文是“总谐波失真加噪声”。
理想的音频功率放大器,若不考虑该功率放大器的增益大小,输入一定频率的正弦波信号,其输出也应该是没有失真(波形没有变形)、没有噪声的正弦波信号。但真实的音频功率放大器的输出音频信号总会有一点失真,并且叠加了噪声(在正弦波上叠加了高频杂波)。波形的失真是由于在正弦波上加了多种高次谐波造成的(如3次谐波、5次谐波等)所以称为总谐波失真。

THD+N是表示失真+噪声,因此THD+N自然是越小越好。

SNR

信噪比,英文名称叫做SNR或S/N(SIGNAL-NOISE RATIO)。
SNR是指一个电子设备或者电子系统中信号与噪声的比例。

设备的信噪比越高表明混在信号里的噪声越小,声音回放的音质量越高,所以,信噪比越高越好。

DoP

DoP(DSD over PCM):在电脑端将DSD信号封包成nbit的PCM编码(n取大于1的整数),借助USB2.0的PCM传输协议,达到传输DSD信号的目的。DoP是早期使用的方式,后来支持DSD Native后就避免了转换的环节,但本质上只是传输方式不同,最终都是完整无损的DSD数据。
DSD Native:直接DSD数据传输,通过USB2.0以1bit 2.822mhz或其倍数传输DSD编码的数字信号。

FAQ

如何获得HiFi音质?

无损音源+优秀的播放软件/播放设备+好前端(DAC和功放)+好耳机。使用优质连接方式和连接线。

胆机和石机比较?

若是以品牌、型号、数量而言,石机所占的份额仍是绝对大于胆机。

胆机的技术指标除了静态互调失真一项能与石机相比外,其余均不如石机。但是,技术指标都是理想假设下得出的数据,只能从一个方面说明问题。

胆机所发出的声音高音冰凉、中音饱满、低音火热、热烈,这种较为“温暖”的声音特点是在回放纯音乐或人声、等音乐时最为人耳所喜爱的,但是胆机最大的弊端就在于其声音“速度感”不强,在播放节奏较快的音乐时并不能让人十分满意;
石机最大的特点就是“速度感”较强,输出功率强劲,但在声音的温暖度上不及胆机,音乐回放效果相比起胆机显得生硬,并不是十分耐听。但是,近些年有些集成功放块的人声也向胆机的人声方面改进。

就音质而言,
一般来说在三万元以下同等价格的放大器,胆机的音质通常优于石机;
在三万至伍万元这个价位上是各有千秋;
在伍万元以上,一般是石机有相对优势,此时石机优的是全面,胆机优的是特点;
在伍万元以下价位的石机,一般来说除了在低音的力度、速度上和高音的冰凉度上能优于胆机外,在音质、音色、音乐性、耐听性上均难以与胆机媲美,这是许多人共同的认识与经验。

为什么前端对音质的影响越来越小,变成玄学了?

https://baijiahao.baidu.com/s?id=1622427450178280272
之前技术不成熟,很多音质上的缺陷不足需要通过各家厂商自己的产品技术进行弥补。比如,磁带机的音源噪音,CD机播放的机械噪音,从而各家播放器/解码器在技术上的差异造成了高低之分。
随着技术的提升、成熟和标准化,一般设备的音质已经上升到了相当高的水平,无论在音源还是前端方面,都没有什么提升空间,从而很难拉开高端和低端产品的差距。更不用说线材,提升就更为有限了。

随着基础水平大幅上升,而发烧的门槛也就越来越高了。等发烧的设备升级到一定水平,设备的参数都高到一定水平,厂家也只能搞一些有的没的东西来忽悠消费者,这就是“玄学”的根源。

常见入门级DAC芯片?

DAC芯片中最著名的名称是ESS(以其SABRE闻名)和Asahi Kasei Microdevices(以天鹅绒之声闻名的AKM)。
其他还有Analog Devices,Burr-Brown(由Texas Instruments拥有),Cirrus Logic和Wolfson等。

常见的入门级别的芯片:

AK4490(AKM)

这块芯片在Digikey的价格是2.34美金,大概价格是18元人民币。性价比非常高,PCM最高支持768kHz/32bit,DSD256。而且THD+N达到了-112dB。声音给人的最大印象是是亮和甜,很讨好耳朵,采用的厂家自然也多。

AK4493(AKM)

这款售价四十块左右的芯片售价上比AK4490EQ贵了一倍,并且采用了与AK4497EQ相同的技术构架。
THD+N达到了-113dB,PCM最高支持384kHz/32bit。

ES9018S、ES9028PRO、ES9038PRO(ESS)

这些是AudiophileDAC系列。ES9018S(是8路DAC)都可以秒了AK4490(只有2路DAC),THD+N是-120dB,到9038PRO、THD+N更是达到了-122dB。9018S是一百多人民币,9028PRO是两百多人民币,而9038PRO据说是60美金以上。

ES9018K2M、ES9028K2M、ES9038Q2M(ESS)

后缀带K2M、Q2M的是MobileDAC系列,也就是大家叫的阉割版。和AudiophileDAC系列的能力不在一个数量级上。
售价方面ES9028Q2M要比AK4493EQ贵上几块钱,ES9028Q2M的THD+N达到了-120dB,PCM最高支持768kHz/32bit。相比于AK和CS系列芯片而言ESS在声音上属于那种芯片没啥调音的类型,属于正统的高解析的数码味。

其他

WM8740(Wolfson),这颗芯片支持24bit/192kHz,THD+N是-102dB。不支持硬解DSD。在技术参数上已经落伍,再加上Wolfson被Cirrus收购。8740也逐渐的退出历史舞台。

CS4398(Cirrus),相比AK4490是万年老二,价格上10块人民币出头,支持24/192,DSD128,THD+N达到-107dB。以别具一格的声音讨好很多人的耳朵——低频弹,高频顺。

PCM1792A(TI),支持24/192、DSD256、THD+N是-108dB,音色上以浓郁温暖著称,早些年的产品,已经临近退休,目前市场价还需要50块人民币左右。

DAC芯片如何决定音质?

https://baijiahao.baidu.com/s?id=1662281875837773290
围绕DAC芯片,会有一堆电路和器件的设计,故音质并不是单纯由DAC芯片来决定的。使用同一个DAC芯片的不同设备,听起来的音质、特色也可能会差别很大。
又比如,采用的DAC芯片的THD+N达到了-112dB,但使用该芯片制作出来的解码设备却不一定能达到该THD+N,需要对设备测量后才可知其THD+N。

运放芯片如何决定音质?

https://page.om.qq.com/page/O2qtyLLJhDFZ7hbL_854jjqQ0
运放在解码中:使用包括运放在内的滤波设计来过滤噪音。
运放在功放中:运放在功放里主要用来解决和解码间的阻抗匹配,如果不匹配,各种指标会变差,比如信号反射,会导致过冲、振铃、抖动等等,带来各种失真。如果运放做积分运算,还能解码DSD。还可以用来做伺服稳压等。

好的运放可以为整个音频系统带来质的飞跃。

运放芯片音质介绍:http://bbs.hifidiy.net/thread-536334-1-1.html

声卡与DAC/功放有什么区别?

声卡本身是包含DAC芯片的,并且还支持麦克风声音输入等功能。

就音质而言,视具体型号而各有音质高低的产品。

Windows上播放器推荐

Foobar2000,是Windows上的一款全能的免费播放器,支持FLAC、WAV、DSD等无损音乐格式,支持众多插件。通过使用ASIO插件可以大幅提升音质。
官网:https://www.foobar2000.org/

Mac上播放器推荐

Foobar2000 Mac版本,由于底层API的不同,只能说是个阉割版的实现,支持FLAC、WAV格式,不支持DSD格式。
官网:https://www.foobar2000.org/

Amarra,收费软件,最大特点是和Mac下的在线无损音乐网站TIDAL和Qobuz无缝集成,并支持itunes音乐,支持FLAC、WAV格式;只支持DSF格式使用DSD到PCM实时转换来播放,不支持Native DoP(据说即将推出该功能2021.10);DIFF格式需要先转换为DSF后才能播放。
官网:https://www.sonicstudio.com/amarra/amarra4.php

Audirvana Plus,收费软件,也支持在线无损音乐网站TIDAL和Qobuz的账号登陆,并支持itunes音乐,支持FLAC、WAV、DSD格式(直接支持DIFF格式,并支持DSD数字输出;没有DSD解码器时,提供DSD转PCM输出)。
官网:https://audirvana.com/

附录

CD光盘版本对音质的影响
耳机基本知识

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

李小白杂货铺

打赏是一种友谊,让我们更亲密。

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值