0. 题目
UNSUPERVISED ACOUSTIC-TO-ARTICULATORY INVERSION NEURAL NETWORK LEARNING BASED ON DETERMINISTIC POLICY GRADIENT
基于确定性策略梯度的未经监督的语音到人工反演神经网络学习
(题目不懂..)
1. 摘要
本文提出了一种深度神经网络的无监督学习方法,该方法对任意话语执行听觉到发音的反转。常规的无监督声转发音反演方法基于综合分析方法和非线性优化算法。一个局限性在于,它们需要耗时的迭代优化来获得给定目标语音片段的发音参数。在学习了它们之间的关系后,神经网络无需迭代优化即可获得这些发音参数。然而,常规方法需要监督学习以及成对的声学和发音样本。我们提出了一种基于混合自动编码器的无监督学习框架,用于可捕获上下文信息的声学到发音反转神经网络。该框架的重点是使每一次的训练有效。我们研究了几种强化学习算法,并显示了确定性策略梯度的有用性。实验结果表明,所提出的方法不仅可以推断出训练参数的发音参数,而且还可以推断出不可见的发音。对于开放测试样品,平均重建误差与传统方法相似,甚至更低
关键词: Physical speech synthesis, acoustic-to-articulatory inversion, analysis-by-synthesis, reinforcement learning, distal lea