ncwf-CSDN博客

原创语音分离笔记2

人类能够在一个拥挤充满噪声的环境中关注某个特定说话者的声音。语音分离可以分为两类：1 语音增强（Speech Enhancement）：人声与非人声的分离。2 语音分离（Speech Separation）：多个说话者声音的分离。

2024-10-04 22:00:37 770

语音分离的最终目的是将目标声音与背景噪声（环境噪声、人声等）进行分离。语音分离还通常被称为“鸡尾酒会问题(cocktail party problem)”。根据说话人（麦克风）的数目，通常将语音分离任务分为单通道(Single-channel)语音分离和麦克风阵列(Multi-channel)的语音分离。语音分离的通常处理流程如上图所示。首先需要一个混合的语音信号（通常包含两到三个人的语音信号）。然后对于时频域的语音分离我们需要将时域的语音信号通过短时傅里叶变换（STFT）将时域信号转换为时频域信号。

2024-10-03 21:52:24 457

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

weixin_56161157的博客

原创语音分离笔记2

原创语音分离笔记1

空空如也

空空如也

原创 语音分离笔记2

原创 语音分离笔记1

空空如也

空空如也

原创语音分离笔记2

原创语音分离笔记1