说话人分离任务不是语音识别任务,而是说话人识别任务。在言语承诺中,这一任务也被称为说话人二值化。Python提供了几个用于说话人二值化和说话人识别的软件包:
SIDEKIT from LIUM
Bob toolkit from Idiap
Speaker diarization from ISCI
如果您不局限于Python,还有其他一些:
LIUM speaker diarization
Speaker recognition setup in Kaldi。包括最新的基于DNN的i-向量称为x-向量。