声学音频基础
声学 语音基本概念
shaobo Huang
化繁为简,高效极致
展开
-
PCM
PCMPCM(Pulse Code Modulation),脉冲编码调制。人耳听到的是模拟信号,PCM是把声音从模拟信号转化为数字信号的技术。原理是用一个固定的频率对模拟信号进行采样,采样后的信号在波形上看就像一串连续的幅值不一的脉冲(脉搏似的短暂起伏的电冲击),把这些脉冲的幅值按一定精度进行量化,这些量化后的数值被连续的输出、传输、处理或记录到存储介质中,所有这些组成了数字音频的产生过程(抽样...原创 2019-09-19 09:14:28 · 1201 阅读 · 0 评论 -
FFT为什么要加窗函数?
当输入信号的频率不是FFT分辨率的整数倍时,信号的能力就会向整个频域扩散,此时那些幅度比较小频点就会被覆盖,使得小幅度频点观察不出来,加窗之后可以防止能量外泄,这样就可以分析那些小幅度频点的特性!可以通俗的理解为防止频率泄露这是数字信号处理的相关知识了。数字信号处理的主要数学工具是傅里叶变换.而傅里叶变换是研究整个时间域和频率域的关系。不过,当运用计算机实现工程测试信号处理时,不可能对无限长的...原创 2019-06-18 09:39:27 · 20619 阅读 · 1 评论 -
VAD(Voice Activity Detection)算法详解
Voice Activity Detection (VAD) 在语音信号处理中,例如语音增强,语音识别等领域有着非常重要的作用。它的作用是从一段语音(纯净或带噪)信号中标识出语音片段与非语音片段。VAD系统通常包括两个部分,特征提取和语音/非语音判决;常用的特征提取可以分为五类:基于能量基于能量的准则是检测信号的强度,并且假设语音能量大于背景噪声能量,这样当能量大于某一门限时,可以认为有语...原创 2019-04-28 15:05:04 · 23919 阅读 · 6 评论 -
单声道”与“立体声”的区别
先来看下什么是这两者的概念单声道(mono):顾名思义,只有一个声道,就是只能输出到一个喇叭上面出声音,比如早期的收音机都是单声道的,耳机就一个耳朵。双声道:就是立体声(Stereo),就是现在你听的歌曲都是对应的耳机两个耳塞、播放器是两个音响的哪种音频。当我们直接听到这些立体空间中的声音时,除了能感受到声音的响度、音调和音色外,还能感受到它们的方位和层次。这种人们直接听到的具有方位层次等空...原创 2019-12-13 14:16:16 · 8595 阅读 · 4 评论 -
WAV格式常见的几种压缩形式(compression code)
WAV为微软公司(Microsoft)开发的一种声音文件格式,它符合RIFF(Resource Interchange File Format)文件规范,用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所广泛支持,该格式也支持MSADPCM,CCITT A LAW等多种压缩运算法,支持多种音频数字,取样频率和声道。标准格式化的WAV文件采样频率为44100Hz,采样比特为...转载 2019-12-05 10:12:37 · 5758 阅读 · 0 评论 -
声音艺术(Sound Art)
我们的主旨,是对声音艺术(sound art)进行哲学上的思考。这并非是基于哲学的概念和原则对声音艺术的领域进行居高临下的评判和审度,而更是希望首先保持倾听的态度,将后者中所创造、实现和传递的强力在哲学的思索之中进一步展现出来。哲学与艺术,本是“一起创作”的关系。何为“声音艺术”?可以突出两个要点。首先,并非所有以声音为材料和元素的创作都是声音艺术,或,并非所有“运用”了声音的艺术形式皆可被...转载 2019-11-29 12:04:47 · 2407 阅读 · 0 评论 -
混响
一、什么是混响?混响是在混音中最重要的一个步骤。了解它能够帮助你很多。不过你要掌握它的话不仅要懂基本的理论,你需要实实在在地使用它,来制作各种有创意的效果。混响,是在一个空间内,声源停止发音后,声音继续存在、反弹的声学现象。其混响时间、频率以及音量都取决于这个空间的大小,形状以及空间里有什么物质。无论是天然的还是人造的,混响都对声音提供了更有深度的效果。同时听者也会潜意识的从混响中得到发生来源...原创 2019-11-14 14:44:29 · 1629 阅读 · 0 评论