自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 语音分离笔记2

人类能够在一个拥挤充满噪声的环境中关注某个特定说话者的声音。语音分离可以分为两类:1 语音增强(Speech Enhancement):人声与非人声的分离。2 语音分离(Speech Separation):多个说话者声音的分离。

2024-10-04 22:00:37 770

原创 语音分离笔记1

语音分离的最终目的是将目标声音与背景噪声(环境噪声、人声等)进行分离。语音分离还通常被称为“鸡尾酒会问题(cocktail party problem)”。根据说话人(麦克风)的数目,通常将语音分离任务分为单通道(Single-channel)语音分离和麦克风阵列(Multi-channel)的语音分离。语音分离的通常处理流程如上图所示。首先需要一个混合的语音信号(通常包含两到三个人的语音信号)。然后对于时频域的语音分离我们需要将时域的语音信号通过短时傅里叶变换(STFT)将时域信号转换为时频域信号。

2024-10-03 21:52:24 457

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除