PIT:Permutation Issue
在模型的两端的声音信号,不知道哪一个是对应的说话者的信息。
简言之,不知道如何摆放你的正确答案。因为这就会涉及到如何计算loss的问题。如何正确的计算loss,不可能是正好结果和参考结果相反去计算loss,这样不就是让模型玩完蛋嘛。。。
就是一种计算loss的方法。
PIT问题:
简单的说:
有一个模型,但是分离出来的掩模信息不知道如何排列,我们先尝试随机排列结果,然后训练,更新参数,然后重新排列,让损失函数更加小,更新参数,直到损失函数收敛为止。
训练效果,如上图,蓝色的线代表S|-SDR的提升,黑色的线代表这一次的 assignment和上一次的 assignment比例,可以看出虽然前期的 assignment,是随机的,但训练的结果是收敛的。