0. 说明
一片具体论文的综述, 不过有些困....么的太听懂 TODO
但是很重要!
- 很关注 Domain 的差异问题, 说不定可以进行到 ASV 模块的参考
- 题目名字: Unsupervised Audio Source Separation Using Generative Priors
- 可能使用音源分离的数据集, 见过各种各样不同的生物和大自然以后, 更有利于使用中英说话人的特征提取
- 但是缺点是, 音源分离的 Prior 需要差别特别大, 才能够分开, 基本不能够分开说话人 (不过目前说话人男女都分不清, 更扯)
- 但是可以对他进行改进, 目前他需要指定几个 Z, 可以加一个 Z1, Z2, others
1. 音源分离用途
略
2. 方法
其中需要注意的一个是 ill-posed 问题, 就比如是声纹的集外提取