linux 单声道数据处理,一次搞懂单声道、双声道、立体声 — 声音处理技术

本文介绍了声音技术的历史,从单声道到立体声、四声道、5.1环绕声,再到面向对象式和场景导向式的声音处理。立体声通过双声道提供更真实的听觉体验,而环绕声通过多个声道实现更沉浸式的听觉享受。随着技术发展,Object-based和Scene-based技术解决了不同设备和场景的适应性问题,提供了更灵活的音频体验。未来的声音格式将更加注重真实性和互动性。
摘要由CSDN通过智能技术生成

原标题:一次搞懂单声道、双声道、立体声 — 声音处理技术

一次搞懂单声道、双声道、立体声 — 声音处理技术

声音技术的发展史

1877年爱迪生除了发明电灯,也发明了第一个可以回放声音的装置,从此之后声音可以被回放。

可以称之为第一代的留声机,在这之前声音无法被回放,只能靠文字想象。我们利用一个声道或音轨来重现声音,我们叫做 Mono 或是单声道。

dc1e3d9f83e8826d1c2b1a676ad6f483.png

双声道、立体声 — Stereo

1931年 EMI 的工程师 AlanBlumlein 认为人类是用两只耳朵听声音,为何我们只有一个喇叭呢?所以他发明了 Stereo,Stereo 需要左右两个喇叭发出不同的声音,所以如果你有两个喇叭播放的是一样的声音,我们还是叫做 Mono。Stereo 因为价格与技术上的问题,一直到 1960 年代才慢慢普及,那时候 Beatles、猫王都开始尝试用 Stereo 来创造,甚至会标示在唱片封面上。

Stereo 虽然叫做立体声,但他离立体还有点距离,因为人类大脑对于判断实体声音超级厉害,以准确度来说大脑的误差在左右正负3度(3度是如果我们画一个时钟是1分钟这么窄)。

66c26fdb7b3d44b9e4b2c5114f360766.png

quadraphonic 四声道

为了要让人的体验更「声」历其境,很自然地会想到增加喇叭的数量,所以后来有了前面两个声道,后面有两个声道的 quadraphonic 四声道。四声道在 1970 年红了一阵子,但很快因为成本的问题消失。

5.1声道 — 环场声、环绕声

ea1e2da9d39184fc1f77a23fe60d02f6.png

5.1 声道

我们现在较长听到的环绕音响或是 surround sound 是 5.1声道,前面有三个声道,后面有两个。像 Dolby Digital,SDDS,DTS 及 Pro Logic II 都是常见的 5.1 声道音效系统。第一次使用是在 1980年代的电影院一直到现在。

但像刚刚提到的,大脑对于判断实体声源超级厉害,所以即使你有5.1环绕音响,你仔细听,还是听得出喇叭的位置,为了解决这个问题,大家开始增加喇叭数目,每个方向都增加喇叭,然后那个喇叭就只播放那个方向的声音就好,所以就有了 6.1 或是 7.1 声道的环绕,利用增加喇叭数目增加声音播放的精确性。

e33c1acdd940254d1a44e774b8ca5637.png

7.1 声道

这种透过增加喇叭数量来增加声音播放的精确性的解决方案,其实不止发生在水平面,也发生在垂直面。所以后来有了 9.1 环绕,这种放在天花板上的高置声道( high channel)。11.1声道把天花板的喇叭数量变成 4 个,增加喇叭无非是为了增加体验和故事的真实性,让每个人能更融入故事。

声音档案制作 — Channel-Based Sound

了解了声道的概念后,那制作声音档案时,我们都希望用户能更沉浸在声音里,那声道又该如何处理呢?举例来说,我今天想让你听到后面有一只恐龙在叫,前面有个人在尖叫,现在传统的做法是以喇叭的数量为出发,我们称作 channel-based 的作法:

dbdb050f7f2899d9ca78d2eaa0f6c819.png

决定声道数为 7.1 声道

首先要决定要用几个喇叭,假设在这个例子里我们用 7 个喇叭的 7.1 声道

115b131478450c59066d411e5d449ff7.png

分配声音

接着我要把恐龙的声音跟尖叫的声音平均分配到他附近的喇叭里面,接着再把七个喇叭的声音全部包成一个档案,拿到了这个档案后就要去找出 7.1 声道的喇叭配置,然后播放档案。

播放档案之后理论上你就能听到恐龙在后面与前面有人在尖叫,这其实是 1 个萝卜一个坑的道理。所以如果你想要听到 5.1 声道的声音,你就同时要有 5.1 声道的档案和 5.1 声道配置的喇叭。

聆听场景与播放设备不断增加,该如何解决?

现在的时代,除了喇叭配置的选择更多外,播放声音的设备跟播放声音的情境、地点越来越多,然而设备也有不同的大小与性能。我们会希望有一种声音格式可以很有弹性,能适应不同的喇叭配置与情况,让消费者可以简单切换。声音产业为了解决这个问题,目前有两个方向:

3896ea7e4c2d1b0ff2dd472c48ba8aa1.gif

Object-based 面向对象式

以刚刚的例子(前面有人尖叫,后面有恐龙叫)来说,身为创作者在 object-based 的方式下要决定「这个恐龙什么时候用多大的音量在哪里大叫」,接着根据不同的喇叭配置(双声道、 5.1、7.1、 22.2声道) ,分别做好设定,最后再把信息都打包成档案,这样播放时就可以依照现有的喇叭配置播放声音。

除此之外 Object-based 还可以把每个声源当作是一个对象,举个例子来说,当你在看一场直播的球赛,如果球赛里的球评、主播、场内的对象都是分别独立的对象,如果你觉得球评很吵,你就可以把球评关掉,只留下场内的声音,你甚至还能选择主队或是客队的欢呼声,以此创造影音内容的互动,也让观看的体验更有趣。

300cf901dca2434875e2466cca10eb38.gif

Scene-based 场景导向式

场景导向式其实是一个相当大的类别,我们比较常听到的是 ambisonic 的技术,ambisonic 的概念在 1970 年就被提出,他的概念有点像 360度影片,假设我们可以在场地中央放一个麦克风,一口气把整个场地的音场录下来,音场搭配上三维的坐标(X.Y.Z),播放时让喇叭配置依照坐标试着重建音场。 360 度影片就是 ambisonic 的应用之一,也是因为 360度影片,2016年初 Youtube 开始支持 ambisonic。

740aa5c47554975e0a979bf35ce3ec25.gif

声音技术的革命正在发生

但是有些问题虽然可以在 Object-based 跟 Scene-based 的技术下解决一部份,但如果声音可以突破声道的限制,那就不会有家里明明有环绕音响,但是看电视的时候听的都是双声道的哀伤。即使有 Object-based 跟 Scene-based 的技术,但是你的设备都是 mono 跟 stereo 的设备 (e.g. 计算机、电视、手机) 那你听到的东西就还是 mono 或 stereo。

责任编辑:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值