GENERALIZED END-TO-END LOSS FOR SPEAKER VERIFICATION

最新推荐文章于 2023-04-04 14:12:34 发布

大鱼不做程序猿

最新推荐文章于 2023-04-04 14:12:34 发布

阅读量490

点赞数

文章标签：神经网络深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40703471/article/details/111190930

版权

GENERALIZED END-TO-END LOSS FOR SPEAKER VERIFICATION（说话人验证的广义端到端损失）

1.2 Tuple-Based End-to-End Loss

基于元组的端到端损失模拟了训练过程中，注册和评估的两个阶段。

以元组作为输入，元组是由J的单个话语和M的不同话语组成的。对于每一个输入的元组，都会计算它经LSTM的L2标准化响应。元组的质心，代表M个发音的声纹。

使用余弦相似度来评判。考虑对正元组和负元组的更新，这个损失函数与FaceNet中的三元组损失非常相似。

1.3 Overview

这种新的体系结构以更有效的方式从不同长度的输入序列中构造元组，显著提高了TD-SV和TI-SV的性能和训练速度。

2.1 Training Method

广义端到端训练是以一次性处理大量的话语为基础，以一批的形式包含了N个说话人，没个说话有M个话语。

在这里插入图片描述

一个批次由N*M组成（N个说话人，每个说话人M个话语&#

最低0.47元/天解锁文章

大鱼不做程序猿

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
GENERALIZED END-TO-END LOSS FOR SPEAKER VERIFICATION

GENERALIZED END-TO-END LOSS FOR SPEAKER VERIFICATION（说话人验证的广义端到端损失）1.2 Tuple-Based End-to-End Loss基于元组的端到端损失模拟了训练过程中，注册和评估的两个阶段。以元组作为输入，元组是由J的单个话语和M的不同话语组成的。对于每一个输入的元组，都会计算它经LSTM的L2标准化响应。元组的质心，代表M个发音的声纹。使用余弦相似度来评判。考虑对正元组和负元组的更新，这个损失函数与FaceNet中的三元组损失非常相
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。