语音分离技术研究已有30-40年的历史。纵观语音分离技术,根据输入源数量的多少来划分,可以分为多通道语音分离技术、双通道语音分离技术和单通道语音分离技术。由于多通道语音分离技术采用多个声源信号同时进行分析,从而分离出想要的单个或多个语音信号,因此可以采用空间信号处理技术或一定的盲源分离技术,其经典算法有ICA, beamform等。相对多通道情况,双通道主要适合如两个声音采集端,即两个麦克风的语音分离任务,现今主要的技术也是盲源分离技术。
相比多通道、双通道的语音分离任务,单通道语音分离任务更具有挑战性。目前为止较为成功的单通道语音分离技术主要还是以CASA(computational auditory scene analysis)为代表或model-based的一类基于语音识别为机理的技术。
本专栏主要想根据我们在研究CASA单通道语音分离技术的经验和总结,对CASA技术及其具体算法进行讨论与学习。栏目目录如下:
1、基本CASA流程
3、CASA的segment过程与算法分析
4、CASA的group过程算法分析
5、model-based CASA
6、基于模型的语音分离技术总结
7、基于missing feature 的 语音分离技术