Sequence discriminative training
语音识别声学模型DNN训练通常用cross-entropy(CE)作为损失函数进行训练,CE可以看做是KL散度的一种形式 ,用来评价期望分布和当前训练模型概率分布的差距。方便计算,所以常常被用来作为损失函数广泛使用。然而基于帧识别的语音识别中,往往用WER或者CER,PER来作为评价语音识别的准确率。损失函数和训练目标不一致,因此本文对基于序列区分度(Sequence Discriminative training)目标函数来进行训练进行了介绍和总结
原创
2017-10-24 15:24:20 ·
3297 阅读 ·
1 评论