在Opus编解码的学习中,常常看到Transient这一概念。今天查了Wiki之后,有以下有用的信息,记录一下。对Transient进行了粗略的翻译,引出的Pre-echo原文贴出。
Wiki词条中提到的MDCT刚好是CELT在使用的,文末涉及的理念Time-Freqeuncy resolution trade-off也在CELT中被提及。
在声学和语音领域,瞬态是一段波形的开端中,一个高幅值,短持续时间的声音。这一现象存在于音乐,噪音和语音中。
瞬态不直接依赖于音调的频率。
瞬态包含高度非周期的分量,拥有比高频分量的谐波更高的幅值。
瞬态很难用音频压缩算法进行编码,会导致pre-echo.
Pre-echo, sometimes called a forward echo, (not to be confused with reverse echo) is a digital audio compression artifact where a sound is heard before it occurs (hence the name). It is most noticeable in impulsive sounds from percussion instruments such as castanets or cymbals.
It occurs in transform-based audio compression algo