最近又看到一个说话人分数评价的技术(paper address here),与之前的AS-Norm相比,训练时间更快且效果也还行,这个说话人分数归一化底层仍然是余弦相似度,其实余弦相似度挺好的,下面来看本文提出的计算说话人分数的公式:
score ( w target ′ , w test ′
最近又看到一个说话人分数评价的技术(paper address here),与之前的AS-Norm相比,训练时间更快且效果也还行,这个说话人分数归一化底层仍然是余弦相似度,其实余弦相似度挺好的,下面来看本文提出的计算说话人分数的公式:
score ( w target ′ , w test ′