实现流程
输入为一段evluation utterance与N段enrollment utterance,网络使用DNN或LSTM,Speaker Model为N段语音的平均值。
损失函数为:
其中target为accept 或者 reject
此模型文本相关,文本为“OK Google”
实验
utterance-level的表现好于frame-level
实现流程
输入为一段evluation utterance与N段enrollment utterance,网络使用DNN或LSTM,Speaker Model为N段语音的平均值。
损失函数为:
其中target为accept 或者 reject
此模型文本相关,文本为“OK Google”
实验
utterance-level的表现好于frame-level